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Acerca del texto 


Este texto se escribió para una secuencia de cursos sobre la teoría y la aplicación de técnicas 
de aproximación numérica. Está diseñado principalmente para los estudiantes avanzados de 
matemáticas y ciencias e ingeniería de nivel básico que han terminado por lo menos el pri- 
mer año de la sucesión de cálculo universitario estándar. La familiaridad con los funda- 
mentos de álgebra de matrices y las ecuaciones diferenciales es útil, pero existe suficiente 
material introductorio sobre estos temas, por lo que los cursos relacionados con ellos no son 
por fuerza requisitos previos. 

Se han usado ediciones previas de Análisis numérico en distintas situaciones. En al- 
gunos casos, el análisis matemático subyacente al desarrollo de técnicas de aproximación 
recibió más énfasis que los métodos; en otros, el énfasis era inverso. El libro se ha utilizado 
como referencia central para los cursos de nivel posgrado en ingeniería, matemáticas, pro- 
gramas de ciencias de la computación y cursos de primer año sobre análisis introductorio 
impartidos en universidades internacionales. Hemos adaptado el libro para ajustarnos a los 
diferentes usuarios sin comprometer nuestro objetivo original: 


Presentar técnicas modernas de aproximación; explicar cómo, porqué y cuándo se pue- 
de esperar que funcionen, y proporcionar las bases para más estudios de análisis numé- 
rico y cálculo científico. 


El libro contiene material suficiente para al menos un año completo de estudio, pero es- 
peramos que muchas personas lo usen solamente para un curso de un solo plazo. En dichos 
cursos, los estudiantes aprenden a identificar los tipos de problemas que requieren técnicas 
numéricas para su solución y observan ejemplos de error de propagación que se pueden 
presentar al aplicar métodos numéricos. Ellos se aproximan con precisión a la solución de 
los problemas que no se pueden resolver exactamente y aprenden técnicas comunes para 
calcular las cotas del error para sus aproximaciones. El resto del texto sirve como referencia 
para los métodos que no se consideran en el curso. El tratamiento tanto para los cursos de 
todo un año como para los cursos de un solo plazo es consistente con la filosofía del texto. 

Prácticamente todos los conceptos en el texto están ilustrados con un ejemplo y esta 
edición contiene más de 2500 ejercicios probados en clase que van desde aplicaciones fun- 
damentales de métodos y algoritmos hasta generalizaciones y extensiones de la teoría. Ade- 
más, los conjuntos de ejercicios incluyen varios problemas aplicados de diversas áreas de 
la ingeniería, así como de la física, la informática, la biología y las ciencias económicas y 
sociales. Las aplicaciones, seleccionadas de forma clara y concisa, demuestran la manera en 
la que las técnicas numéricas pueden y, a menudo, se aplican en situaciones de la vida real. 

Se ha desarrollado una serie de paquetes de software, conocidos como Sistemas de 
Álgebra Computacional (CAS) para producir cálculos matemáticos simbólicos. Maple?, 
MathematicaO y MATLABC destacan еп el ambiente académico. Existen versiones para 
estudiantes de estos paquetes de software a un precio razonable para la mayoría de los 
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sistemas informáticos. Además, ahora existe Sage, un sistema de código abierto. La infor- 
mación sobre este sistema se puede encontrar en el sitio 


http://www.sagemath.org 


Aunque existen diferencias entre los paquetes, tanto de desempeño como de precio, 
todos efectúan operaciones de cálculo y algebraicas estándar. 

Los resultados en muchos de nuestros ejemplos y ejercicios se han generado por medio 
de problemas para los que se pueden determinar valores exactos ya que esto permite mejorar 
el desempeño de la supervisión del método de aproximación. Además, para muchas técnicas 
numéricas, el análisis de error requiere limitar una derivada ordinaria o parcial superior de 
una función, lo cual puede ser una tarea tediosa y que no es especialmente instructiva una 
vez que se dominan las técnicas de cálculo. Por lo tanto, tener un paquete informático simbó- 
lico puede ser muy útil en el estudio de las técnicas de aproximación porque, a menudo, las 
soluciones exactas se obtienen fácilmente por medio de cálculos simbólicos. Las derivadas 
se pueden obtener simbólicamente de manera rápida y, con frecuencia, un poco de perspec- 
tiva permite que el cálculo simbólico también ayude al proceso de limitación. 


т Algoritmos y programas 


En nuestra primera edición, presentamos una característica que en ese tiempo era innovado- 
ra y controvertida. En lugar de presentar nuestras técnicas de aproximación en un lenguaje 
de programación específico (FORTRAN dominaba en esa época), dimos algoritmos en un 
pseudocódigo que conduciría a un programa bien estructurado en una variedad de lengua- 
jes. Al inicio de la segunda edición, listamos los programas en lenguajes específicos en el 
Manual del Instructor para el libro y el número de estos lenguajes se ha incrementado en 
las ediciones posteriores. Ahora, codificamos los programas y están disponibles en línea 
en varios de los lenguajes de programación más comunes y hojas de cálculo CAS. Todos 
estos se encuentran en el sitio web que acompaña al libro (consulte “Complementos” [dispo- 
nibles sólo para la edición en inglés y se venden por separado]). 

Para cada algoritmo existe un programa escrito en Fortran, Pascal, С y Java. Además, 
codificamos los programas usando Maple, Mathematica y MATLAB. Esto debería garantizar 
que haya un conjunto de programas disponibles para la mayoría de los sistemas de compu- 
tadora comunes. 

Todos los programas se ilustran con un programa muestra, correlacionado estrechamen- 
te con el texto. Esto permite ejecutar inicialmente el programa en el lenguaje de su elección 
para observar el formato de entrada y salida. A continuación, los programas se pueden mo- 
dificar para otros problemas al realizar cambios menores. Los formatos de entrada y salida 
son, en la medida de lo posible, iguales en cada uno de los sistemas de programación. Esto 
permite al instructor usar los programas para analizarlos de manera genérica, de manera in- 
dependiente del sistema de programación particular que use un solo estudiante. 

Los programas están diseñados para ejecutarse en una computadora con configuraciones 
mínimas y se proporciona en formato ASCII para permitir flexibilidad de uso. Esto hace mo- 
dificarlos mediante cualquier editor o procesador de palabras que cree archivos ASCII están- 
dar. (En general, también reciben el nombre de archivos “sólo texto”.) Se incluyen archivos 
README extensos junto con los archivos del programa, por lo que las peculiaridades de 
diferentes sistemas de programación se pueden abordar de manera individual. Los archivos 
README se presentan tanto en formato ASCII como en archivos PDF. Puesto que se de- 
sarrolla software nuevo, los programas se actualizarán y colocarán en el sitio web del libro. 

Para la mayoría de los sistemas de programación se necesita software adecuado, como un 
compilador para Pascal, Fortran y C, o uno de los Sistemas de Álgebra Computacional (Maple, 
Mathematica y MATLAB). Las implementaciones Java son una excepción. Usted necesita el 
sistema para ejecutar los programas, pero Java se puede descargar gratis desde diferentes sitios 
web. La mejor forma de obtener Java es utilizar un motor de búsqueda para buscar el nombre, 
seleccionar el sitio web de descarga y seguir las instrucciones provistas en el mismo. 
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NON Nuevo en esta edición 


La primera edición de este libro se publicó hace más de 35 años, en la década anterior a los 
avances más importantes en técnicas numéricas, los cuales reflejan la amplia disponibilidad 
del equipo informático. En nuestras revisiones del libro, hemos añadido técnicas nuevas, en 
un intento por mantener nuestro trato actual. Para continuar con esta tendencia, realizamos 
una serie de cambios significativos en esta edición: 


e Reescribimos algunos de los ejemplos en el libro para enfatizar mejor el problema que se 
va a resolver antes de proporcionar la solución. Agregamos pasos adicionales a algunos 
de los ejemplos para mostrar explícitamente los cálculos requeridos para los primeros pa- 
sos de los procesos de iteración. Esto da a los lectores una forma de probar y depurar los 
programas que escriben para problemas similares a los ejemplos. 


e Dividimos los ejercicios del capítulo en computacionales, aplicados y teóricos рага pro- 
porcionar más flexibilidad al instructor al asignar la tarea. Casi en todas las situaciones 
computacionales los ejercicios se emparejaron de forma par e impar. Puesto que los pro- 
blemas impares se resuelven en la última parte del texto, si los problemas pares se asignan 
como tarea los estudiantes podrán trabajar los problemas impares y verificar sus respues- 
tas antes de resolver el problema par. 


e Agregamos muchos ejercicios aplicados nuevos al texto. 


e Incluimos preguntas de análisis después de cada sección del capítulo, principalmente para 
uso del instructor en los cursos en línea. 


e Renombramos la última sección de cada capítulo y la dividimos en cuatro subsecciones: 
Software numérico, Preguntas de análisis, Conceptos clave y Revisión del capítulo (que 
se encuentran disponibles en línea). La mayoría de las Preguntas de análisis llevan al es- 
tudiante hacia áreas modernas de investigación en el desarrollo de software. 


e Reorganizamos partes del texto para facilitar la instrucción en línea. 


e Agregamos diapositivas en PowerPoint para complementar el material de lectura (dispo- 
nibles sólo para la versión en inglés). 


e Actualizamos el material bibliográfico para reflejar las nuevas ediciones de los libros que 
consultamos. Agregamos nuevas fuentes que antes no estaban disponibles. 


Como siempre con nuestras revisiones, examinamos todos los enunciados para determinar si 
estaban redactados de la mejor forma relacionada con lo que tratamos de describir. 


|] 2 Complementos 


Los autores crearon un sitio web que acompaña el libro, el cual contiene los materiales com- 
plementarios que se mencionan más adelante. El sitio web se encuentra en 


https: //sites.google.com/site/numericalanalysis 1 burden/ 


es para estudiantes e instructores. Parte del material en el sitio web es sólo para uso del 
instructor. Los instructores pueden acceder al material protegido al contactar a los autores 
para obtener la contraseña (disponibles sólo para la versión en inglés y se venden por 
separado). 
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Algunos de los complementos también se pueden obtener en 
https://www.cengagebrain.com 


mediante la búsqueda del ISBN (disponibles sólo para la versión en inglés). 


1. Ejemplos del programa para estudiantes que contienen código Maple, Matlab y 
Excel para que los estudiantes lo utilicen para resolver problemas del texto. Está 
organizado en forma paralela al texto, capítulo por capítulo. Se ilustran los coman- 
dos en estos sistemas. Los comandos se presentan en segmentos de programa muy 
cortos para mostrar la forma de resolver los ejercicios sin programación extensa. 


2. Conferencias para estudiantes que contienen una perspectiva adicional al contenido 
del capítulo. Estas conferencias se escribieron principalmente para el aprendiz en 
línea, pero pueden ser útiles para estudiantes que toman el curso de manera tradicio- 
nal. 


3. Guía de estudio para el estudiante que contiene las soluciones de muchos de los 
problemas. Los primeros dos capítulos de esta guía están disponibles en el sitio 
web del libro en formato PDF, por lo que los posibles usuarios pueden decir si los 
encuentran suficientemente útiles. Toda la guía se puede obtener sólo a partir del 
editor al llamar a Cengage Learning Customer & Sales Support al 1-800-354-9706 
o al ordenar en línea en http://www.cengagebrain.com/. 


4. Programas de algoritmo que son programas completos escritos en Maple, Matlab, 
Mathematica, C, Pascal, Fortran y Java para todos los algoritmos en el texto. Estos 
programas están previstos para estudiantes más experimentados en lenguajes de 
programación. 

5. Diapositivas en PowerPoint para el instructor en formato PDF para uso del ins- 
tructor, tanto para cursos tradicionales como en línea. Contacte a los autores para 
obtener la contraseña. 


6. Manual del instructor que provee respuestas y soluciones para todos los ejercicios 
en el libro. Los resultados de los cálculos en el Manual del Instructor se regeneraron 
para esta edición mediante los programas en el sitio web para garantizar la compa- 
tibilidad entre los diferentes sistemas de programación. Contacte a los autores para 
obtener la contraseña. 


7. Pruebas muestra para el instructor para uso del instructor. Contacte a los autores 
para obtener la contraseña. 


8. Erratas. 


PF Posibles sugerencias para el curso 


Análisis numérico está diseñado para proporcionar flexibilidad a los instructores al elegir los 
temas, así como en el nivel de rigor teórico y en el énfasis sobre las aplicaciones. Junto con 
estos Objetivos, proporcionamos referencias detalladas para los resultados que no se demues- 
tran en el texto y para las aplicaciones que se utilizan para señalar la importancia práctica 
de los métodos. Las referencias de los textos citados son aquellas que se pueden encontrar 
con mayor facilidad en las bibliotecas universitarias y se actualizaron para reflejar ediciones 
recientes. También incluimos citas de los documentos originales de investigación cuando 
sentimos que este material es accesible para nuestra audiencia prevista. Todos los materiales 
consultados se han indexado en las ubicaciones adecuadas en el texto y se incluye la infor- 
mación sobre la convocatoria de la Biblioteca del Congreso para el material de referencia 
para permitir localizarlo fácilmente al buscarlo en la biblioteca. 

El siguiente diagrama de flujo indica los requisitos previos del capítulo. La mayor parte 
de las secuencias posibles que se pueden generar a partir de este diagrama fueron enseñadas 
por los autores en Youngstown State University. 
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El material en esta edición debe permitir a los instructores preparar un curso universita- 
rio de álgebra lineal numérica para los estudiantes que no han estudiado análisis numérico 
antes. Esto se puede realizar al cubrir los capítulos 1, 6,7 y 9. 


Capítulo 1 
Y Y 
Capítulo 2 Capítulo 6 Capítulo 3 


Y Y y Y Y 
Capítulo 10 Capítulo 7 Capítulo 8 Capítulo 4 Capítulo 5 


Y 


Capítulo 9 


>| Capítulo 112 


Y 


Capítulo 12 
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CAPÍTULO 


Preliminares matemáticos 
y análisis de error 


Introducción 


Al comenzar los cursos de química, estudiamos la ley del gas ideal, 
PV = NRT, 


que relaciona la presión P, el volumen V, la temperatura T y el número de moles N de un 
gas “ideal”. En esta ecuación, R es una contante que depende del sistema de medición. 

Suponga que se realizan dos experimentos para evaluar esta ley, mediante el mismo gas 
en cada caso. En el primer experimento, 


Р = 1.00 atm, V = 0.100 т?, 
N = 0.00420 mol, R = 0.08206. 


La ley del gas ideal predice que la temperatura del gas es 


PV (1.00) (0.100) 
NR (0.00420)(0.08206) 


T= = 290.15 К = 17°C. 


Sin embargo, cuando medimos la temperatura del gas, encontramos que la verdadera tem- 
peratura es 15°С. 


A continuación, repetimos el experimento utilizando los mismos valores de R y N, pero 
incrementamos la presión en un factor de dos y reducimos el volumen en ese mismo factor. 
El producto PV sigue siendo el mismo, por lo que la temperatura prevista sigue siendo 17°С. 
Sin embargo, ahora encontramos que la temperatura real del gas es 19°С. 
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Claramente, se sospecha la ley de gas ideal, pero antes de concluir que la ley es inválida 
en esta situación, deberíamos examinar los datos para observar si el error se puede atribuir 
a los resultados del experimento. En este caso, podríamos determinar qué tan precisos de- 
berían ser nuestros resultados experimentales para evitar que se presente un error de esta 
magnitud. 

El análisis del error involucrado en los cálculos es un tema importante en análisis nu- 
mérico y se presenta en la sección 1.2. Esta aplicación particular se considera en el ejercicio 
26 de esa sección. 

Este capítulo contiene una revisión breve de los temas del cálculo de una sola variable 
que se necesitarán en capítulos posteriores. Un conocimiento sólido de cálculo es fundamen- 
tal para comprender el análisis de las técnicas numéricas y sería preciso efectuar una revi- 
sión más rigurosa para quienes no han estado en contacto con este tema durante un tiempo. 
Además, existe una introducción a la convergencia, el análisis de error, la representación 
de números en lenguaje de máquina y algunas técnicas para clasificar y minimizar el error 
computacional. 


SS] 1.1 Revisión de cálculo 


Límites y continuidad 


Los conceptos de límite y continuidad de una función son fundamentales para el estudio del 
cálculo y constituyen la base para el análisis de las técnicas numéricas. 


Definición 1.1 Una función f definida en un conjunto X de números reales que tiene el límite L a xo, escrita 


como 
Ит fœ) = 2, 


x—> xo 


si, dado cualquier número real e > 0, existe un número real ô > 0, de tal forma que 


Ifœ)-— L| <e, siempre que хєХ y 0 <|x— xo] < ô. 


(consulte la figura 1.1) п 


Figura 1.1 


Definición 1.2 
Los conceptos básicos de 
cálculo y sus aplicaciones se 
desarrollaron a finales del siglo 
хуп y a principios del хуш, pero 
los conceptos matemáticamente 
precisos de límites y continuidad 
se describieron hasta la época 
de Augustin Louis Cauchy 
(1789-1857), Heinrich Eduard 
Heine (1821-1881) y Karl 
Weierstrass (1815-1897) a finales 
del siglo хІх. 


Definición 1.3 


Teorema 1.4 


Definición 1.5 
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Sea funa función definida en un conjunto X de números reales y xy € X. Entonces f es con- 
tinua en хо si 


lim Јо) = foo). 


La función f es continua en el conjunto X si es continua en cada número en X. ш 


El conjunto de todas las funciones que son continuas еп el conjunto X se denota como 
C(X). Cuando X es un intervalo de la recta real, se omiten los paréntesis en esta notación. Por 
ejemplo, el conjunto de todas las funciones continuas en el intervalo cerrado [a, b] se denota 
como Cla, b]. El símbolo R denota el conjunto de todos los números reales, que también 
tiene la notación del intervalo (—оо, оо). Por eso el conjunto de todas las funciones que son 
continuas en cada número real se denota mediante C(R) o mediante С(—оо, оо). 

El límite de una sucesión de números reales o complejos se define de manera similar. 


Sea {xn}; una sucesión infinita de números reales. Esta sucesión tiene el límite x (conver- 
ge a х) si, para cualquier e > 0, existe un entero positivo N(e) tal que |х, —x| < e siempre 
que n > N(e). La notación 


йт хь =x, O хех en n> œ, 
п оо 
significa que la sucesión {х, }2 у converge а х. п 


Si f es una función definida en un conjunto X de números reales y хо € X, entonces los si- 
guientes enunciados son equivalentes: 


a. fes continua en хо; 


b. Si {х„)20 у es cualquier sucesión en X, que converge a xo, entonces 
йт, оо Р(х) = f (хо). и 


Se asumirá que las funciones que consideraremos al analizar los métodos numéricos son 
continuas porque éste es el requisito mínimo para una conducta predecible. Las funciones 
que no son continuas pueden pasar por alto puntos de interés, lo cual puede causar dificulta- 
des al intentar aproximar la solución de un problema. 


Diferenciabilidad 


Las suposiciones más sofisticadas sobre una función por lo general conducen a mejores re- 
sultados de aproximación. Por ejemplo, normalmente una función con una gráfica suave se 
comportaría de forma más predecible que una con numerosas características irregulares. La 
condición de uniformidad depende del concepto de la derivada. 


Si f es una función definida en un intervalo abierto que contiene хо. La función f es diferen- 


ciable en xp si 
f'(x) = Иш FO) fo) 


—>X0 Xx — Xo 


existe. El número /'(хо) recibe el nombre de derivada de fen xy. Una función que tiene una 
derivada en cada número en un conjunto X es diferenciable en X. п 


La derivada de fen хо es la pendiente de la recta tangente a la gráfica de fen (xo, f (xo)), 
como se muestra en la figura 1.2. 
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Figura 1.2 


Teorema 1.6 


El teorema atribuido a Michel 
Rolle (1652-1719) apareció 

en 1691 en un tratado poco 
conocido titulado Méthode pour 
résoundre les égalites (Método 
para resolver las igualdades). 
Originalmente, Rolle criticaba 
el cálculo desarrollado por Isaac 
Newton y Gottfried Leibniz, pero 
después se convirtió en uno de 
sus defensores. 


Teorema 1.7 


Figura 1.3 
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La recta tangente tiene 
una pendiente f'(xọ) 


(хо, FX) у = Р(х) 


Si la función f es diferenciable en хо, entonces fes continua en хо. п 


Los siguientes teoremas son de importancia fundamental al deducir los métodos para 
estimación del cálculo de error. Las pruebas de estos teoremas y los otros resultados sin refe- 
rencias en esta sección se pueden encontrar en cualquier texto de cálculo estándar. 

El conjunto de todas las funciones que tienen derivadas continuas n en X se denota como 
С"(Х) y el conjunto de funciones que tienen derivadas de todos los órdenes en X se denota 
como C“(X). Las funciones polinomial, racional, trigonométrica, exponencial у logarítmi- 
ca se encuentran en C“(X), donde X consiste en todos los números para los que se definen 
las funciones. Cuando X es un intervalo de la recta real, de nuevo se omiten los paréntesis 
en esta notación. 


(Teorema de Rolle) 


Suponga que f e Cla, b] y f es diferenciable en (a, b). Si f(a) = f (b), entonces existe un nú- 
mero c en (a, b) con f'(c) = 0. (Consulte la figura 1.3.) п 


Fa) = fb) 


(Teorema del valor medio) 


Si f e Cla, b] y f es diferenciable en (a, b), entonces existe un número c en (a, b) con 
(consulte la figura 1.4.) 


Р) – fla) 


0) = = 


Figura 1.4 


Teorema 1.9 


Figura 1.5 


Ejemplo 1 
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Líneas paralelas 


Pendiente /'(с) 


endiente 


F(b) – Ха) 
b= 


a 


(Teorema del valor extremo) 


Sife Cla, b], entonces existe сі, c2 € [a, b] con (с) < f(x) < f(c2), para todas las x є [a, b]. 
Además, si f es diferenciable en (a, b), entonces se presentan los números с| y сә ya sea en 
los extremos de [a, b] o donde f’ es cero. (Consulte la figura 1.5.) ш 


Encuentre los valores mínimo absoluto y máximo absoluto de 


ДО) = 2— e + 2х 
en los intervalos a) [0, 1] y b) [1, 2]. 
Solución Comenzamos por derivar f(x) para obtener 
F0)=-e +2. 


ЈО) = 0 cuando —e* + 2 = 0 o de forma equivalente, cuando e* = 2. Al tomar el logaritmo 
natural de ambos lados de la ecuación obtenemos 


In (e) = In (2) o x = In (2) ~ 0.69314718056 
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Teorema 1.10 


Teorema 1.11 


Figura 1.6 


a) Cuando el intervalo es [0, 1], el extremo absoluto debe ocurrir en £(0), F(n (2)), о 
FU). Al evaluar, tenemos 


0) =2- e +2(0) = 1 
Хаа (2)) = 2 — е0) +21 (2) = 21n (2) ~ 1.38629436112 


fQ) =2-е+2(1) =4—e*= 1.28171817154. 


Por lo tanto, el mínimo absoluto de f(x) en [0, 1] es f(0) = 1 y el máximo 
absoluto es f (ln (2)) = 2 In (2). 


b) Cuando el intervalo es [1, 2], sabemos que f'(x) 4 0, por lo que el extremo 
absoluto se presenta en f(1) у f(2). Por lo tanto, f (2) = 2 — e+20)=6-e= 
—1.3890560983 
El mínimo absoluto en [1, 2] es 6 — e? y el máximo absoluto es 1. 

Observamos que 


¿máx |/(х)| = |6 — e?| ~ 1.3890560983. н 


En general, el siguiente teorema no se presenta en un curso de cálculo básico, pero se 
deriva al aplicar el teorema de Rolle sucesivamente a f, f”,... , y finalmente, a f”7” . Este 
resultado se considera en el ejercicio 26. 


(Teorema generalizado de Rolle) 


Suponga que f € Cl[a, b] es n veces diferenciable en (а, b). Si f(x) = 0 en los n + 1 números 
distintos a a < xy < ху <... < Xn < b, entonces un número с en (хо, Xn) y, por lo tanto, en (a, b) 
existe con (с) = 0. п 


También utilizaremos con frecuencia el teorema del valor intermedio. A pesar de que 
esta declaración parece razonable, su prueba va más allá del alcance del curso habitual de 
cálculo. Sin embargo, se puede encontrar en muchos textos de análisis (consulte, por ejem- 
plo, [Fu], p. 67). 

(Teorema del valor intermedio) 
Si f e Cla, b] y K es cualquier número entre f(a) y f(b), entonces existe un número с en 
(a, b) para el cual f(c) = K. a 


La figura 1.6 muestra una opción para el número garantizada por el teorema del valor 
intermedio. En este ejemplo, existen otras dos posibilidades. 


(a, f(a)) 
у= 0) 


(b, F(b)) 


Ejemplo 2 


Definición 1.12 


George Fredrich Berhard Riemann 
(1826-1866) realizó muchos de 
los descubrimientos importantes 
para clasificar las funciones 

que tienen integrales. También 
realizó trabajos fundamentales en 
geometría y la teoría de funciones 
complejas y se le considera uno 

de los matemáticos prolíferos del 
siglo ХІХ. 


Figura 1.7 
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Muestre que х? — 2 + 3x?— 1 = 0 tiene una solución en el intervalo [0, 1]. 


Solución Considere la función definida por f(x) = х? — 2х + 3x? — 1. La función f es 
continua en [0, 1]. Además, 


fÑO=-1<0 y  0<1=f0). 


Por lo tanto, el teorema del valor intermedio implica que existe un número с, соп 0 < c < 1, 
para el cual сє? — 2с? + 3с^°— 1 = 0. ш 


Como se observa en el ejemplo 2, el teorema del valor intermedio se utiliza para deter- 
minar cuándo existen soluciones para ciertos problemas. Sin embargo, no provee un medio 
eficiente para encontrar estas soluciones. Este tema se considera en el capítulo 2. 


Integración 


El otro concepto básico del cálculo que se utilizará ampliamente es la integral de Riemann. 


La integral de Riemann de la función fen el intervalo [a, b] es el siguiente límite, siempre 
y cuando exista: 


b n 
[тоа = lím o 2 F 60 Ал, 


máx Лх; > 


donde los números xo, X1,... , Xn satisfacen а = хо < ху <... < Xn= b, donde Ах; = xi — Xi—1, 
рага cada і = 1, 2,..., п, у z; se selecciona de manera arbitraria en el intervalo [ х; 1, х;]. в 


Una función f que es continua en un intervalo [а, b] es también Riemann integrable en 
[а, b]. Esto nos permite elegir, para conveniencia computacional, los puntos x, se separarán 
equitativamente en [a, b] para cada i = 1, 2, ... , п, para seleccionar z; = ху. En este caso, 


олыга 
f ге x= Иш ==) f&), 


i=1 


donde los números mostrados en la figura 1.7, como ху, son x; = a + ¡(b — а)/п. 


Se necesitarán otros dos resultados en nuestro estudio para análisis numérico. El primero 
es una generalización del teorema del valor promedio para integrales. 
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Teorema 1.13 


Figura 1.8 


Teorema 1.14 


Brook Taylor (1685-1731) 
describió esta serie en 1715 
en el artículo Methodus 
incrementorum directa et inversa 
(Métodos para incrementos 
directos e inversos). Isaac 
Newton, James Gregory y 
otros ya conocían algunos 
casos especiales del resultado 
y, probablemente, el resultado 
mismo. 


(Teorema del valor promedio para integrales) 


Suponga que f e Cla, b], la integral de Riemann de g existe en [a, b], y g(x) no cambia de 
signo en [a, b]. Entonces existe un número c en (a, b) con 


b b 
/ Р(х) (х) а= 30 | g(x) dx. Е 


Cuando g(x) = 1, el teorema 1.13 es el teorema del valor medio para integrales. Éste 
proporciona el valor promedio de la función f sobre el intervalo [a, b] como (consulte la 
figura 1.8.) 


1 b 
ло = р | Fx) ах. 
—a Ja 


En general la prueba del teorema 1.13 no se da en un curso básico de cálculo, pero se 
puede encontrar en muchos textos de análisis (consulte, por ejemplo, [Fu], p. 162) 


Polinomios y series de Taylor 


El teorema final en esta revisión de cálculo describe los polinomios de Taylor. Estos polino- 
mios se usan ampliamente en el análisis numérico. 


(Teorema de Taylor) 


Suponga que f e С"[а, b], "+ existe en [a, b], y xo € [a, b]. Para cada x e [a, b], existe un 
número £(x) entre хоу x con 


Fx) = P, Œ) F R, (x), 


donde 


f” (хо) 
(x 
2 


| xo) +: 


Р(х) =f (хо) + (хо) — хо) + 


(n) 
2.35 Pe) ci (x — хо)” 
п: 
= > FU оо) 
| 


a ©” xo)“ 


k=0 


Colin Maclaurin (1698-1746) es 
más conocido como el defensor 
del cálculo de Newton cuando 
éste fue objeto de los ataques 
implacables del obispo y filósofo 
irlandés George Berkeley. 


Maclaurin no descubrió la 
serie que lleva su nombre; los 
matemáticos del siglo ya la 
conocían desde antes de que él 
naciera. Sin embargo, concibió 
un método para resolver un 
sistema de ecuaciones lineales 
que se conoce como regla de 
Cramer, que Cramer no publicó 
hasta 1750. 


Ejemplo 3 


Figura 1.9 
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SDE) 


Е п+1 
К„(х) = AFD! (х = х0)". a 


Aquí Р(х) es llamado el n-ésimo polinomio de Taylor para f alrededor de xo y А„(х) 
recibe el nombre de residuo (o error de truncamiento) relacionado con P,(x). Puesto que el 
número é (х) en el error de truncamiento Ё„(х) depende del valor de х donde se evalúa el poli- 
nomio P,(x), es una función de la variable x. Sin embargo, no deberíamos esperar ser capaces 
de determinar la función &(х) de manera explícita. El teorema de Taylor simplemente garantiza 
que esta función existe y que su valor se encuentra entre x y хо. De hecho, uno de los problemas 
comunes en los métodos numéricos es tratar de determinar un límite realista para el valor de 
fOD (E(x)) cuando x se encuentra en un intervalo específico. 

La serie infinita obtenida al tomar el límite de P,,(x) conforme п —> оо recibe el nombre 
de serie de Taylor para f alrededor de xp. En caso de que хо = 0, entonces al polinomio de 
Taylor con frecuencia se le llama polinomio de Maclaurin y a la serie de Taylor a menudo 
se le conoce como serie de Maclaurin. 

El término error de truncamiento en el polinomio de Taylor se refiere al error implica- 
do al utilizar una suma truncada, o finita, para aproximar la suma de una serie infinita. 


Si f(x) = cos x y х = 0. Determine 


a) el segundo polinomio de Taylor para f alrededor de хо; y 


b) el tercer polinomio de Taylor para f alrededor de хо. 


Solución Puesto que f є C(R), el teorema de Taylor puede aplicarse a cualquiera п > 0. 


Además, 
f (0) = – ѕвепх, f(x) =—cosx, f"(x)=senx, y (х) = соѕх, 


Por lo tanto 


FO0)=1, /'0)=0, F0)==1, y /”(0)=0. 
a) Paran = 2 ухо = 0, obtenemos 
cosx = fO) E /'(0)х E LP $ 60) 


Е И 
= 1 — -x^ + -x° sen E(x), 
2 6 


donde £(x) es algún número (por lo general, desconocido) entre O y x. (Consulte la figura 1.9.) 


y = cosx 


10 
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Cuando x = 0.01, esto se convierte en 


—6 


1 1 10 
соѕ0.01 = 1 — 500.01) + 600.01) sen £(0.01) = 0.99995 + sen £(0.01). 


Por lo tanto, la aproximación para cos 0.01 provista por el polinomio de Taylor es 0.99995. 
El error de truncamiento, o término restante, relacionado con esta aproximación es 


—6 


sen £(0.01) = 0.16 x 1076 sen &(0.01), 


donde la barra sobre el 6 en 0 .16 se utiliza para indicar que este dígito se repite indefinida- 
mente. A pesar de que no existe una forma de determinar sen & (0.01), sabemos que todos los 
valores del seno se encuentran en el intervalo [—1, 1], por lo que el error que se presenta si 
utilizamos la aproximación 0.99995 para el valor de cos 0.01 está limitado por 


| cos(0.01) — 0.99995] = 0.16 х 1076] sen £(0.01)| < 0.16 х 107. 


Por lo tanto, la aproximación 0.99995 corresponde por lo menos a los primeros cinco dígitos 
de cos 0.01 y 


0.9999483 < 0.99995 — 1.6 x 107% < соѕ0.01 
< 0.99995 + 1.6 x 107% < 0.9999517. 


El límite del error es mucho más grande que el error real. Esto se debe, en parte, al esca- 
so límite que usamos para | sen (x)|. En el ejercicio 27 se muestra que para todos los valores 
de x, tenemos | sen x| < |x|. Puesto que 0 < £ < 0.01, podríamos haber usado el hecho de 
que | sen £(x)| < 0.01 en la fórmula de error, lo cual produce el límite 0.16 x 1078, 

b) Puesto que (0) = 0, el tercer polinomio de Taylor con el término restante alre- 
dedor de xy = 0 es 


i= 2d а Ea) 
cosx = l — -x — x” cos é (x), 
2 24 


donde0 < ¿(x) < 0.01. El polinomio de aproximación sigue siendo el mismo y la aproxima- 
ción sigue siendo 0.99995, pero ahora tenemos mayor precisión. Puesto que | cos Ë (x)| < 1 
para todas las x, obtenemos 


| ta cos (x) 


< 1 oono д 4.2 x 107”, 
24 = 24 


por lo tanto 


| cos 0.01 — 0.99995] < 4.2 x 107, 


0.99994999958 = 0.99995 — 4.2 x 107" 
< cos0.01 < 0.99995 + 4.2 х 107!° = 0.99995000042. E 
El ejemplo 3 ilustra los dos objetivos del análisis numérico: 
i) Encuentre una aproximación a la solución de un problema determinado. 
ii) Determine un límite o cota para la precisión de la aproximación. 


Los polinomios de Taylor en ambas partes proporcionan la misma respuesta para i), pero el 
tercero provee una respuesta mucho mejor para ii) que el segundo. También podemos utilizar 
estos polinomios para obtener aproximaciones de las integrales. 


Ilustración 
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Podemos utilizar el tercer polinomio de Taylor y su término restante encontrado en el ejem- 
е 0.1 
plo 3 para aproximar de cos х dx. Tenemos 


0.1 0.1 1 1 0.1 _ 
/ cos х dx = / l==41 de += x*cos¿(x) dx 
0 0 2 24 Јо 


0.1 "0.1 
х— ыл += х* cos (х) dx 
0 24 Jo 


01 10.1) + 2 f tatea 
= ЫА == = Ar = X COS X ^^ 
6 24} 


Por lo tanto, 
0.1 1 
| cosx dx ~ 0.1 — ¿OD? = 0.09983. 
0 


Un límite o cota para el error en esta aproximación se determina a partir de la integral del 
término restante de Taylor y el hecho de que | cos (x)| < 1 para todas las x: 


0.1 _ 1 0.1 2 
/ х“ cos (х) dx <z x*| cos (x)| dx 
0 24 Jo 


24 


El valor verdadero de esta integral es 


0.1 


0.1 
/ cos х dx = sen J = sen 0.1 = 0.099833416647, 
0 0 


por lo que el error real para esta aproximación es 8.3314 x 1078, que se encuentra dentro 
del límite del error. п 


La sección Conjunto de ejercicios 1.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Errores de redondeo y aritmética computacional 


La aritmética realizada con una calculadora o computadora es diferente a la aritmética que 
se imparte en los cursos de álgebra y cálculo. Podría esperarse que declaraciones como 
2+2 = 4,4-8 = 32,y (43)? = 3 siempre sean verdaderas; sin embargo con la aritmética 
computacional, esperamos resultados exactos para 2+2 = 4 y 4-8 = 32, pero no obtendre- 
mos exactamente (4/3)2 = 3. Para comprender por qué esto es verdadero, debemos explorar 
el mundo de la aritmética de dígitos finitos. 

En nuestro mundo matemático tradicional, permitimos números con una cantidad infini- 
ta de dígitos. La aritmética que usamos en este mundo define МЗ como el único número po- 
sitivo que cuando se multiplica por sí mismo produce el entero 3. No obstante, en el mundo 
computacional, cada número representable sólo tiene un número fijo y finito de dígitos. Esto 
significa que, por ejemplo, sólo los números racionales, e incluso no todos ellos, se pueden 
representar de forma exacta. Ya que МЗ no es racional, se proporciona una representación 
aproximada, cuyo cuadrado no será exactamente 3, a pesar de que es probable que esté sufi- 
cientemente cerca de 3 para ser aceptable en la mayoría de las situaciones. Entonces, en mu- 
chos casos, esta aritmética mecánica es satisfactoria y pasa sin importancia o preocupación, 
pero algunas veces surgen problemas debido a su discrepancia. 
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El error debido al redondeo 
debería esperarse siempre que se 
realizan cálculos con números 
que no son potencias de 2. 
Mantener este error bajo control 
es en extremo importante cuando 
el número de cálculos es grande. 


Ilustración 


El error que se produce cuando se utiliza una calculadora o computadora para realizar 
cálculos con números reales recibe el nombre de error de redondeo. Se presenta porque la 
aritmética realizada en una máquina incluye números con un solo número finito de dígitos, 
y esto da como resultado cálculos realizados únicamente con representaciones aproximadas 
de los números reales. En una computadora, sólo un subconjunto relativamente pequeño del 
sistema de números reales se usa para la representación de todos los números reales. Este 
subconjunto sólo contiene números racionales, tanto positivos como negativos, y almacena 
la parte fraccionaria, junto con una parte exponencial. 


Números de máquina binarios 


En 1985, el Instituto para Ingenieros Eléctricos y Electrónicos (IEEE; Institute for Electri- 
cal and Electronic Engineers) publicó un reporte llamado Binary Floating Point Arithmetic 
Standard 754-1985 (Estándar para la aritmética binaria de punto flotante). En 2008 se 
publicó una versión actualizada con el nombre de JEEE 754-2008; la cual proporciona es- 
tándares para números de punto flotante decimales y binarios, formatos para intercambio 
de datos, algoritmos para redondear operaciones aritméticas y manejo de excepciones. Se 
especifica cuáles son los formatos para las precisiones individuales, dobles y ampliadas y, en 
general, todos los fabricantes de microcomputadoras que utilizan hardware de punto flotante 
siguen estos estándares. 

Una representación de 64 bits (dígito binario) se usa para un número real. El primer bit 
es un indicador de signo, denominado s. А éste le sigue un exponente de 11 bits, с, llamado 
característica, y una fracción binaria de 52 bits, f, llamada mantisa. La base para el expo- 
nente es 2. 

Puesto que los 52 dígitos binarios corresponden con dígitos decimales entre 16 y 17, 
podemos asumir que un número representado en este sistema tiene por lo menos 16 dígitos 
decimales de precisión. El exponente de 11 dígitos binarios provee un rango de Оа 2'! — 1 
= 2047. Sin embargo, usar sólo enteros positivos para el exponente no permitiría una re- 
presentación adecuada de los números con magnitud pequeña. Para garantizar que estos 
números son igualmente representables, 1023 se resta a la característica, por lo que el rango 
del exponente en realidad se encuentra entre —1023 y 1024. 

Para ahorrar almacenamiento y proporcionar una representación única para cada número 
de punto flotante, se impone una normalización. Por medio de este sistema obtenemos un 
número de punto flotante de la forma 


(60027 99 (1-6). 
Considere el número de máquina 
0 10000000011 1011100100010000000000000000000000000000000000000000. 


El bit más a la izquierda es ѕ = 0, lo cual indica que es un número positivo. Los siguientes 
11 bits, 10000000011, proveen la característica y son equivalentes al número decimal 


e=1-2+0-2+...+0-224+1.2141.22=10244+2+1= 1027. 


La parte exponencial del número es, por lo tanto, 21077-10233 — 24, Los 52 bits finales espe- 
cifican que la mantisa es 


Ae” 
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Como secuencia, este número de máquina representa precisamente el número decimal 


І 1 1 1 1 1 
-1 52с—1023 1 = (1 0 ‚ 21027—1023 1 
(=) О+ 5 = (1) +15 ++ 76 + 3 1 256 * 1096 


= 27.56640625. 
Sin embargo, el siguiente número de máquina más pequeño es 
O 10000000011 101110010000111111111111 11111 1111111111 1111111111111, 
el siguiente número de máquina más grande es 
0 10000000011 1011100100010000000000000000000000000000000000000001. 


Esto significa que nuestro número de máquina original no sólo representa 27.56640625, sino 
también la mitad de los números reales que se encuentran entre 27.56640625 y el siguiente 
número de máquina más pequeño, así como la mitad de los números entre 27.56640625 y 
el siguiente número de máquina más grande. Para ser preciso, representa cualquier número 


[27.5664062499999982236431605997495353221893310546875, 
27.5664062500000017763568394002504646778 106689453125). н 


El número positivo normalizado más pequeño que se puede representar tiene s = 0, с = 1, 
y f=0 y es equivalente 


AAN, 
y el más grande tiene s = 0, c = 2046 y f= 1 — 2? y es equivalente а 
21999 „б = ОЛОТ. 


Los números que se presentan en los cálculos que tienen una magnitud menor que 
271022 А (1 $ 0) 


resultan en un subdesbordamiento y, en general, se configuran en cero. Los números supe- 
riores a 


21023 А (2 == q 


resultan en desbordamiento y, comúnmente, causan que los cálculos se detengan (a menos 
que el programa haya sido diseñado para detectar estas presencias). Observe que existen 
dos representaciones рага el número сего: un 0 positivo cuando s = 0, с= Оуѓ= 0, y un 0 
negativo cuando s =1,c=0yf=0. 


Números de máquina decimales 


El uso de dígitos binarios tiende a ocultar las dificultades computacionales que se presentan 
cuando se usa una colección finita de números de máquina para representar todos los núme- 
ros reales. Para examinar estos problemas, utilizaremos números decimales más familiares 
en lugar de una representación binaria. En específico, suponemos que los números máquina 
se representan en formato normalizado de punto flotante decimal 


+0.did,...di x 10", 1<di¡<9 y 0<4<9, 
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El error que resulta de 
reemplazar un número con 

esta forma de punto flotante 

se llama error de redondeo, 
independientemente de si se 
usa el método de redondeo o de 
corte. 


Ejemplo 1 


En general, el error relativo es 
una mejor medición de precisión 
que el error absoluto porque 
considera el tamaño del número 
que se va a aproximar. 


Definición 1.15 


Ejemplo 2 
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para cada і = 2,... ‚К. Los números de esta forma reciben el nombre de números de 
máquina decimales de dígito k. 

Cualquier número real positivo dentro del rango numérico de la máquina puede ser 
normalizado a la forma 


y= 0.didz Faa арала saa X 10". 


La forma de punto flotante de y, que se denota fl(y), se obtiene al terminar la mantisa de y 
en los dígitos decimales de k. Existen dos maneras comunes para realizar esta terminación. 
Un método, llamado de corte, es simplemente cortar los dígitos dy, ¡dx+2 . . . Esto produce 
la forma de punto flotante 


FIO) =0.d1d> ... dy x 10". 


El otro método, llamado redondeo, suma 5 х 10"4+D а y y entonces corta el resultado 
para obtener un número con la forma 


FIO) =0.8182 ... 8, х 10". 


Para redondear, cuando d;,1 > 5, sumamos 1 a d; para obtener fl (y); es decir, redondeamos 
hacia arriba. Cuando у < 5, simplemente cortamos todo, excepto los primeros dígitos 
k; es decir, redondeamos hacia abajo. Si redondeamos hacia abajo, entonces ô; = d;, para 
cada і =1,2,... ‚К. Sin embargo, si redondeamos hacia arriba, los dígitos (e incluso el 
exponente) pueden cambiar. 


Determine los valores a) de corte y b) de redondeo de cinco dígitos del número irracional 7. 


Solución El número л tiene una expansión decimal infinita de la forma л = 3.14159265 .... 
Escrito en una forma decimal normalizada, tenemos 


л = 0.314159265... х 10}. 


а) El formato de punto flotante de л usando el recorte de cinco dígitos es 


fI) = 0.31415 x 10! = 3.1415. 


b) El sexto dígito de la expansión decimal de л es un 9, por lo que el formato de punto 
flotante de л con redondeo de cinco dígitos es 


Рт) = (0.31415 + 0.00001) х 10! = 3.1416. ш 
La siguiente definición describe tres métodos para medir errores de aproximación. 


Suponga que p* es una aproximación а p. El error real es р — р“, el error absoluto es 
Ip — р“| 


|р — p*|, y el error relativo es ipi 


, siempre y cuando р Æ 0. ш 


Considere los errores real, absoluto y relativo al representar р con p* en el siguiente ejemplo. 


Determine los errores real, absoluto y relativo al aproximar р con р“ cuando 


а) р = 0.3000 x 10! y p* = 0.3100 x 10!; 
b) p = 0.3000 x 1073 y p* = 0.3100 х 1073; 
e) р = 0.3000 x 10* y p* = 0.3100 x 10%. 


A menudo no podemos encontrar 
un valor preciso para el error 
verdadero en una aproximación. 
Por el contrario, encontramos 
una cota para el error, lo cual nos 
proporciona un error del “peor 
caso”. 


Definición 1.16 


A menudo, el término dígitos 
significativos se usa para 
describir vagamente el número 
de dígitos decimales que parecen 
ser exactos. La definición es más 
precisa y provee un concepto 
continuo. 


Tabla 1.1 
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Solución 
a) Para p = 0.3000 x 10! y p* = 0.3100 х 10!, el error real es -0.1, el error absoluto 
es 0.1 y el error relativo es 0.3333 x 107. 
b) Para p = 0.3000 x 10° y р* = 0.3100 x 107°, el error real es -0.1 x 10%, el error 
absoluto es 0.1 x 107* y el error relativo es 0.3333 x 107! 
c) Para p = 0.3000 x 10* ур“ = 0.3100 х 104, el error real es -0.1 х 10%, el error ab- 
soluto es 0.1 x 10° y, de nuevo, el error relativo es 0.3333 х 107!, 


Este ejemplo muestra que el mismo error relativo, 0.3333 х 107!, se presenta para errores 
absolutos ampliamente variables. Como una medida de precisión, el error absoluto puede ser 
engañoso y el error relativo más significativo debido a que este error considera el tamaño 
del valor. ш 


Un límite de error ез un número no negativo mayor que el error absoluto. Algunas ve- 
ces se obtiene con los métodos de cálculo para encontrar el valor absoluto máximo de una 
función. Esperamos encontrar el límite superior más pequeño posible para el error a fin de 
obtener un estimado del error real que es lo más preciso posible. 

La siguiente definición usa el error relativo para proporcionar una medida de dígitos 
significativos de precisión para una aproximación. 


Se dice que el número р“ se aproxima a p para 1 dígitos significativos (o cifras) si г es el 
entero no negativo más grande para el que 


a 
ІРР 5-е, и 
|р| 


La tabla 1.1 ilustra la naturaleza continua de los dígitos significativos al enumerar, para 
los diferentes valores de p, el límite superior mínimo de |р — p*|, denominado тах. |p — р“, 
cuando р“ concuerda con р en cuatro dígitos significativos. 


р 0.1 0.5 100 1000 5000 9990 10000 


тах |p = p*| 0.00005 0.00025 0.05 0.5 23 4.995 5. 


Al regresar a la representación de los números de máquina, observamos que la represen- 
tación de punto flotante f(y) para el número y tiene el error relativo 


>л) 
| 


Si se usan К dígitos decimales y corte para la representación de máquina de 
у= 0.445 гав акак © жа. Ж 10", 


entonces 


у= (у) | |0.did>...dideyr... x 10” – 0.14... x 10" 
y Е 0.410... х 10" 
_ О.а... х 10" 
Е О.А... х 10" 


И нее ... 


х 107%, 
0.4%... 
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Ejemplo 3 


Puesto que dı 4 О, el valor mínimo del denominador es 0.1. El numerador se limita en la 
parte superior mediante 1. Como consecuencia, 


Ln 
y 


< e х 107“ = 107!. 
0.1 


De igual forma, un límite para el error relativo al utilizar aritmética de redondeo de dígitos k 
es 0.5 x 107*+!. (Consulte el ejercicio 28.) 

Observe que los límites para el error relativo mediante aritmética de dígitos k son inde- 
pendientes del número que se va a representar. Este resultado se debe a la forma en la que se 
distribuyen los números de máquina a lo largo de la recta real. Debido al formato exponen- 
cial de la característica, el mismo número de los números de máquina decimales se usa para 
representar cada uno de los intervalos [0.1, 1], [1, 10] y [10, 100]. De hecho, dentro de los 
límites de la máquina, el número de los números de máquina decimales en [10”, 10"+!] es 
constante para todos los enteros л. 


Aritmética de dígitos finitos 


Además de la representación inexacta de números, la aritmética que se efectúa en una compu- 
tadora no es exacta. La aritmética implica manipular dígitos binarios mediante diferentes 
operaciones de cambio, o lógicas. Puesto que la mecánica real de estas operaciones no es 
pertinente para esta presentación, debemos idear una aproximación propia para aritmética 
computacional. А pesar de que nuestra aritmética no proporcionará el panorama exacto, es 
suficiente para explicar los problemas que se presentan. (Para una explicación de las manipu- 
laciones realmente incluidas, se insta al lector a consultar textos de ciencias computacionales 
con una orientación más técnica, como [Ma], Computer System Architecture [Arquitectura 
de sistemas computacionales.) 

Piense que las representaciones de punto flotante fI(x) y fI(y) están dadas рага los nú- 
meros reales x y y y que los símbolos Ө, O, S, y Ө representan operaciones de máquina 
de suma, resta, multiplicación y división, respectivamente. Supondremos una aritmética de 
dígitos finitos provista por 


xy = FIFI) + FIO), х®у= FIFI) x fI), 
xOy = (х) – FO), xy = FIFI) =+ flO). 


Esta aritmética corresponde a realizar aritmética exacta en las representaciones de punto flo- 
tante de x y y y, después, convertir el resultado exacto a su representación de punto flotante 
de dígitos finitos. 


Suponga que x = 2 Уу = L Utilice el corte de cinco dígitos para calcular x + y, х — y, х х y, 
ух у. 


Solución Observe que 
5 е: 1 Е 
= 5 = 0.714285 = = = 0.3 
КЗ к=, 


implica que los valores de corte de cinco dígitos de x y y son 


Р(х) = 0.71428 х 10 y (у) = 0.33333 х 10°. 


Por lo tanto, 
x0 y = Р(х) + FI) = fl (0.71428 x 10% + 0.33333 x 10°) 
= fl (1.04761 х 10%) = 0.10476 x 10!. 


Tabla 1.2 


Ejemplo 4 
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El valor verdadero es x + y = 5 F 1 = РА рог lo que tenemos 


22 
Error absoluto = |57 — 0.10476 x 10'| = 0.190 x 107* 
y 
. 0.190 x 1074 24 
Error relativo = | ————|=0.182 х 10”, 
22/21 
La tabla 1.2 enumera los valores de éste y otros cálculos. п 
Орегас1бп Resultado Valor real Error absoluto Error relativo 
xy 0.10476 x 10! 22/21 0.190 x 107* 0.182 x 107* 
xOy 0.38095 x 10° 8/21 0.238 х 1075 0.625 х 1075 
х @у 0.23809 x 10% 5/21 0.524 х 1075 0.220 х 107* 
х Өу 0.21428 х 10! 15/7 0.571 x 107* 0.267 x 107* 


El error relativo máximo para las operaciones en el ejemplo 3 es 0.267 x 107*, por lo 
que la aritmética produce resultados satisfactorios de cinco dígitos. Este no es el caso en el 
siguiente ejemplo. 


Suponga que además de x = 5 y y = 1 tenemos 
u = 0.714251, v=98765.9, y w =0.111111 x 1074, 
de tal forma que 


и) = 0.71425 х 10°,  fl(v) = 0.98765 х 105, у fl(w)=0.11111 x 107*. 


Determine los valores de corte de cinco dígitos dex Ө u, (х Ө и) Өм, (хӨи) 9 о,уиФо. 


Solución Estos números fueron seleccionados para ilustrar algunos problemas que pueden 
surgir con la aritmética de dígitos finitos. Puesto que x y u son casi iguales, su diferencia es 
pequeña. El error absoluto para x O u es 


[Gx =u) – x Өш| =|(% = u) – (FIFI) — FU)! 
= G - 0714251) — (/1 (0.71428 х 10° — 0.71425 x 10°)) 
= [0.347143 х 1074 — f1 (0.00003 х 10°)| = 0.47143 x 107°. 


Esta aproximación tiene un error absoluto, pero un error relativo grande 


47143 х 1075 
o A яве 


0.347143 x 1074 


La división subsiguiente entre el número pequeño w o la multiplicación por el número gran- 
de v magnifica el error absoluto sin modificar el error relativo. La suma de los números 
grande y pequeño u y v produce un error absoluto grande, pero no un error relativo grande. 
Estos cálculos se muestran en la tabla 1.3. п 
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Tabla 1.3 


Ejemplo 5 


Operación Resultado Valor real Error absoluto Error relativo 
xou 0.30000 x 1074 0.34714 x 1074 0.471 x 1075 0.136 
(хӨи) Ө» 0.27000 х 10! 0.31242 х 10! 0.424 0.136 
(хӨи) ®ъ 0.29629 х 10' 0.34285 х 10! 0.465 0.136 
иФо 0.98765 х 10° 0.98766 х 10° 0.161 х 10! 0.163 x 107* 


Uno de los cálculos más comunes que producen errores implica la cancelación de dígi- 
tos significativos debido a la resta de números casi iguales. Suponga que dos números casi 
iguales x y y, con x > y, tienen las representaciones de dígitos k 


FU) =0.did>...dyAp+10p+2 - - 0% X 10" 


Fly) = 0.4\4›...4ьбВь+уВр+ә.... бу X 10". 


El formato de punto flotante de x — y es 


FFL) — /1(у)) =0.0p4+10p+42 0% х 10", 


donde 
0.0p+10p+2 ... Ok = 0.0 рът ро з ОДЕ = 0.Bp+1Bp+2 а» Br. 


El número de punto flotante que se usa para representar x — y tiene por lo menos k — p 
dígitos significativos. Sin embargo, en muchos dispositivos de cálculo a x — y se le asignarán 
k dígitos, con la última p igual a cero o asignada de manera aleatoria. Cualquier otro cálculo 
relacionado con x — y conserva el problema de tener solamente k — p dígitos significativos, 
puesto que una cadena de cálculos no es más precisa que su parte más débil. 

Si una representación o un cálculo de dígitos finitos presenta un error, otra ampliación 
del error ocurre al dividir entre un número de menor magnitud (o, de manera equivalente, al 
multiplicar por un número de mayor magnitud). Suponga, por ejemplo, que el número z tiene 
una aproximación de dígitos finitos z + 8, en donde el error б se introduce por representación 
o por cálculo previo. Ahora divida entre = = 107”, en donde п > 0. Entonces 


2 FU 
== fl 
4 Es 


€ 


) = (z +06) x 10”. 


El error absoluto en esta aproximación, |ô| х 10", es el error absoluto original, |ô|, multipli- 
cado por el factor 10”. 


Si p = 0.54617 y q = 0.54601. Use aritmética de cuatro dígitos para aproximar р — q y de- 
termine los errores absoluto y relativo mediante a) redondeo y b) corte. 


Solución El valor exacto de r =p — q es r = 0.00016. 


a) Suponga que se realiza la resta con aritmética de redondeo de cuatro dígitos. Al 
redondear p y q a cuatro dígitos obtenemos p* = 0.5462 y q* = 0.5460, respec- 
tivamente, y r* = p* — q* = 0.0002 es la aproximación de cuatro dígitos para r. 
Puesto que 


Ir —r*| _ 10.00016 — 0.0002] 


=0.25, 
lr] [0.00016] 


Ilustración 


Las raíces xı y х› de una 
ecuación cuadrática general están 
relacionadas con los coeficientes 
por el hecho de que 


b С 
xı +x: = -- Y мю = –. 

а а 
Éste es un caso especial de 


las fórmulas de Viéta para los 
coeficientes de los polinomios 
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el resultado sólo tiene un dígito significativo, mientras p* y q* sean precisos para 
cuatro y cinco dígitos significativos, respectivamente. 

b) Sise usa el corte para obtener los cuatro dígitos, la aproximación de cuatro dígitos 
рага р, q, y r son р“ =0.5461,q* = 0.5460, y r* = p* — q* = 0.0001. Esto nos 


da 
= r* .00016 — 0.0001 
|r r*| _ 10.000 0 0375. 
ir] |0.00016| 
lo que también resulta en un solo dígito significativo de precisión. ш 


A menudo, la pérdida de precisión debido al error de redondeo se puede evitar al 
reformular los cálculos, como se ilustra en el siguiente ejemplo. 


La fórmula cuadrática establece que las raíces de ax?+bx+c=0, cuando a Æ 0, son 


—b + Vb? — 4ас —b — yb? — 4ac 
— з _, x = —————. 


_ 2а y 2a 


(1.1) 
Considere esta fórmula aplicada a la ecuación x? + 62.10x + 1 = 0, cuyas raíces son apro- 
ximadamente 


xı = —0.01610723 y ж = —62.08390. 


Usaremos otra vez la aritmética de redondeo de cuatro dígitos en los cálculos para determi- 
nar la raíz. En esta ecuación, b? es mucho más grande que 4ac, por lo que el numerador en el 
cálculo para xı implica la resta de números casi iguales. Ya que 


Vb? — дас = y(62.10)? — (4.000)(1.000)(1.000) 
= 13856. — 4.000 = V3852. = 62.06, 


tenemos 
—62.10 + 62.06  —0.04000 
Лех) = т = = —0.02000, 
2.000 2.000 
una aproximación deficiente a ху = — 0.01611, con un error relativo grande 


| — 0.01611 + 0.02000] 
| — 0.01611| 


x 2.4 x 107. 


Por otro lado, el cálculo рага x implica la suma de los números casi iguales —b y 
у b? — 4ac. Esto no presenta problemas debido а que 


—62.10 — 62.06 —124.2 
fix) = = = —62.10 
2.000 2.000 


tiene un error relativo pequeño 


— 62.08 + 62.10 
| + | x 3.2 x 107%. 
| — 62.08| 


Para obtener una aproximación por redondeo de cuatro dígitos para х, modificamos el 
formato de la fórmula cuadrática al racionalizar el numerador: 


ХІ 


6+ М2 — 4ас Б у – 4ас \ _ b? — (b? — 4ас) 
Е 2а —b — Vb — Дас)  2a(—b — Vb? — дас)’ 
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Ejemplo 6 


Tabla 1.4 


la cual se simplifica en una fórmula cuadrática alterna: 


—2c 
b + Б? — ac (1.2) 


Por medio de la ecuación (1.2) obtenemos 


Xx] = 


2.000 2.000 


1 = = 
Йе) = 621046206 1242 


= —0.01610, 


que бепе el error relativo pequeño 6.2 х 1074. 
La técnica de racionalización también puede aplicarse para proporcionar la siguiente 
fórmula cuadrática alterna para хә: 


—2с 
b= vb — дас’ (1.3) 


Éste es el formato que se usa si b es un número negativo. En la ilustración, sin embargo, el 
uso erróneo de esta fórmula рага xz по sólo resultaría en la resta de números casi iguales, 
sino también en la división entre el resultado pequeño de esta resta. La falta de precisión que 
produce esta combinación, 


х = 


=2с —2.000 —2.000 


l = = = = —50.00, 
ны b — ~b? — 4ac 62.10 — 62.06 0.04000 
tiene el error relativo grande 1.9 х 107!, п 


e La lección: ¡Piense antes de calcular! 
Aritmética anidada 


La pérdida de precisión debido a un error de redondeo también se puede reducir al reacomo- 
dar los cálculos, como se muestra en el siguiente ejemplo. 


Evalúe f(x) = x? — 6.1x? + 3.2x + 1.5 en x = 4.71 con aritmética de tres dígitos. 


Solución La tabla 1.4 provee los resultados intermedios de los cálculos. 


х х? х) 6.1x? 3.2x 
Exacto 4.71 22.1841 104.487111 135.32301 15.072 
Tres dígitos (corte) 4.71 22.1 104. 134. 15.0 
Tres dígitos (redondeo) 4.71 22.2 105. 135. 15.1 


Para ilustrar los cálculos, observemos los que participan para encontrar х? usando la 


aritmética de redondeo de tres dígitos. Primero encontramos 


x? = 471? = 22.1841 que se redondea a 22.2. 


A continuación, usamos este valor de e para encontrar 


x? = x? - x = 22.2 -4.71 = 104.562 que se redondea a 105. 


Además, 


6.1x? = 6.1(22.2) = 135.42 que se redondea a 135, 


Ilustración 


Recuerde que el corte (o redondeo) 
se realiza después del cálculo. 
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3.2x = 3.2(4.71) = 15.072 que se redondea a 15.1. 


El resultado exacto de la evaluación es 
Exacto: / (4.71) = 104.487111 — 135.32301 + 15.072 + 1.5 = —14.263899, 


Con la aritmética de dígitos finitos, la forma en la que sumamos los resultados puede afectar 
el resultado final. Suponga que lo hacemos de izquierda a derecha. Entonces, para la aritmé- 
tica de corte tenemos 


Tres dígitos (corte): f (4.71) = ((104. — 134.) + 15.0) + 1.5 = —13.5, 
y para la aritmética de redondeo tenemos 
Tres dígitos (redondeo): f (4.71) = ((105. — 135.) + 15.1) + 1.5 = —13.4. 


(Usted debe verificar de manera cuidadosa estos resultados para asegurarse de que su noción 
de aritmética de dígitos finitos es correcta.) Observe que los valores de corte de tres dígitos 
sólo retienen los tres dígitos principales, sin incluir redondeo, y difieren significativamente 
de los valores de redondeo de tres dígitos. 

Los errores relativos para los métodos de tres dígitos son 


—14.263899 + 13.5 —14.263899 + 13.4 
Corte: сг ^ 0.05, y redondeo: z = 0.06. 
— 14.263899 —14.263899 


Como enfoque alternativo, el polinomio f(x) en el ejemplo 6 se puede reescribir de forma 
anidada como 


f(x) = x? — 6.1х2 + 3.2х + 1.5 = ((x — 6.1)х + 3.2)х + 1.5. 
Ahora, la aritmética de corte de tres dígitos produce 


$4.71) =((4.71 — 6.1)4.71 + 3.2)4.71 + 1.5 = ((—1.39)(4.71) + 3.2)4.71 + 1.5 
=(—6.54 + 3.2)4.71 + 1.5 = (—3.34)4.71 + 1.5 = —15.7 + 1.5 = —14.2. 


De manera similar, ahora obtenemos una respuesta de redondeo de tres dígitos de —14.3. Los 
nuevos errores relativos son 


o —14.263899 + 14.2] 04 
Tres dígitos (corte): 214.263899 | > 
A н 
res dígitos (redondeo): —14.263899 “ч | 


El anidado ha reducido el error relativo para la aproximación de corte a menos de 10% del 
valor obtenido al inicio. Para la aproximación de redondeo, la mejora ha sido todavía más 
drástica; el error, en este caso, se ha reducido más de 95 por ciento. Г 


Los polinomios siempre deberían expresarse en forma anidada antes de realizar una 
evaluación porque esta forma minimiza el número de cálculos aritméticos. La disminución 
del error en la ilustración se debe a la reducción de los cálculos de cuatro multiplicaciones y 
tres sumas a dos multiplicaciones y tres sumas. Una forma de disminuir el error de redondeo 
es reducir el número de cálculos. 


La sección Conjunto de ejercicios 1.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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El uso de algoritmos es tan 
antiguo como las matemáticas 
formales pero el nombre se 
deriva del matemático árabe 
Muhammad ibn-Msá al- 
Khwarárizmí (c. 780-850). La 
traducción latina de sus trabajos 
comenzó con las palabras “Dixit 
Algorismi”, que significan 
“al-Khwarárizmí dice”. 


Ilustración 


А 1.3 Algoritmos y convergencia 


A lo largo del texto examinaremos procedimientos de aproximación, llamados algoritmos, 
los cuales incluyen secuencias de cálculos. Un algoritmo es un procedimiento que describe, 
de manera inequívoca, una secuencia finita de pasos que se desarrollarán en un orden espe- 
cífico. El objeto del algoritmo es implementar un procedimiento para resolver un problema 
O aproximar una solución para el problema. 

Nosotros usamos un pseudocódigo para describir los algoritmos. Este pseudocódigo des- 
cribe la forma de la entrada que se proporcionará y la forma de la salida deseada. No todos los 
procedimientos proporcionan una salida satisfactoria para una entrada seleccionada de manera 
arbitraria. Como consecuencia, se incluye una técnica de detención independiente de la téc- 
nica numérica en cada algoritmo para evitar ciclos infinitos. 

En los algoritmos se usan dos símbolos de puntuación: 


e Un punto (.) indica el final de un paso. 
e Punto y coma (;) separan las tareas dentro de un paso. 


La sangría se usa para indicar que los grupos de declaraciones se tratarán como una sola 
entidad. 
Las técnicas de ciclado en los algoritmos también son controladas por contador, como 


Para ОЕТ г: 


tome x=a+i-h 


O controladas por condición, como 
Mientras і < N realice los pasos 3-6. 
Para permitir una ejecución condicional, usamos las construcciones estándar 


Si... entonces о Si... entonces 


sino 


Los pasos en los algoritmos siguen las reglas de la construcción del programa estruc- 
turado. Se han ordenado de tal forma que no debería ser difícil traducir el pseudocódigo en 
cualquier lenguaje de programación adecuado para aplicaciones científicas. 

Los algoritmos están mezclados libremente con comentarios. Éstos se escriben en itá- 
licas y se encuentran entre paréntesis para distinguirlos de las declaraciones algorítmicas. 

NOTA: Cuando es difícil determinar el final de ciertos pasos anidados utilizamos un 
comentario como (fin del paso 14) a la derecha o debajo de la declaración de finalización. 
Consulte, por ejemplo, el comentario en el paso 5, en el ejemplo 1. 


N 
El siguiente algoritmo calcula xı + 0 + ··· + ху = 5 xi, dado N y los números 
Kis Kiedy AN i=1 
ENTRADA  N,x¡,xX2,... х». 
SALIDA SUM= У х. 
Paso 1 Tome SUM=0.  (nicialice el acumulador.) 


Paso 2 Parai=1,2,...,N hacer 
Tome SUM = SUM + x;. (Añadir el siguiente término.) 


Paso З SALIDA (SUM); 
PARE. ш 


Ejemplo 1 
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El n-ésimo polinomio de Taylor para f(x) = In x ampliado alrededor de xy = 1 es 


N руін | 
Pra) = У! 7 (xD, 


і=1 


y el valor de In 1.5 para los ocho lugares decimales es 0.40546511. Construya un algoritmo 
para determinar el valor mínimo de N requerido para 


| In 1.5 — Py(1.5)| < 107% 


sin utilizar el término restante del polinomio de Taylor. 


РУ . z . оо . 6 . 
Solución A partir del cálculo sabemos que si У, у a, es una serie alterna con límite A cu- 


yos términos disminuyen en magnitud, entonces A y la n-ésima suma parcial Ay = a An 
difieren por menos en la magnitud del término (N + 1); es decir, 


|A — Ал| < law+11. 
El siguiente algoritmo utiliza este hecho. 


ENTRADA valor х, tolerancia TOL, número máximo de iteraciones М. 
SALIDA grado N del polinomio o un mensaje de falla. 
Paso 1 SeaN = 1; 


у=х- 1; 

SUM = 0; 

POWER = у; 

TERM = у; 

SIGN = —1. (Se utiliza para implementar la alternancia de los signos.) 


Paso 2 Mientras N < M haga los pasos 3-5. 


Paso 3 Determine SIGN = —SIGN; (Alterne los signos.) 
SUM = SUM + SIGN - TERM,  (Acumule los términos.) 
POWER = POWER - у; 
TERM = POWER/(N + 1). (Calcule el siguiente término.) 
Paso 4 Si|TERM|< TOL entonces (Prueba para la precisión.) 
SALIDA (N); 
PARE. (El procedimiento fue exitoso.) 


Paso 5 Determinar N = N + 1. (Preparar la siguiente iteración. (Fin del paso 2)) 


Paso 6 SALIDA (“El método falló”); (El procedimiento no fue exitoso.) 
PARE. 


La entrada para nuestro problema es x = 1.5, TOL = 10”? y tal vez M = 15. Esta elección 
de M provee un límite o una cota superior para el número de cálculos que queremos realizar, 
al reconocer que el algoritmo probablemente va a fallar si se excede este límite. La salida es 
un valor para N o el mensaje de fracaso que depende de la precisión del dispositivo compu- 
tacional. п 


Algoritmos de caracterización 


Consideraremos diversos problemas de aproximación a lo largo del texto y en cada caso 
necesitamos determinar métodos de aproximación que producen resultados precisos fiables 
para una amplia clase de problemas. Debido a las diferentes formas de derivar los métodos 
de aproximación, requerimos una variedad de condiciones para clasificar su precisión. No 
todas estas condiciones son apropiadas para cualquier problema en particular. 
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La palabra estable tiene la misma 
raíz que las palabras posición 

y estándar. En matemáticas, el 
término estable aplicado a un 
problema indica que un pequeño 
cambio en los datos o las 
condiciones iniciales no resultan 
en un cambio drástico en la 
solución del problema. 


Definición 1.17 


Figura 1.10 


Ilustración 


Un criterio que impondremos en un algoritmo, siempre que sea posible, es que los pe- 
queños cambios en los datos iniciales producen, de forma proporcional, pequeños cambios 
en los resultados finales. Un algoritmo que satisface esta propiedad recibe el nombre de 
estable; de lo contrario, es inestable. Algunos algoritmos son estables sólo para ciertas elec- 
ciones de datos iniciales y reciben el nombre de estables condicionalmente. Clasificaremos 
las propiedades de estabilidad de los algoritmos siempre que sea posible. 

Para considerar más el tema del crecimiento del error de redondeo y su conexión con 
la estabilidad del algoritmo, suponga que se presenta un error con una magnitud Еу > 0 еп 
alguna etapa en los cálculos y que la magnitud del error después de n operaciones subsi- 
guientes se denota con E,,. En la práctica, los dos casos que surgen con mayor frecuencia se 
definen a continuación. 


Suponga que Ey > O denota un error que se presenta en alguna etapa en los cálculos y Е, 
representa la magnitud del error después de n operaciones subsiguientes. 


e Si E, ~ С"Ео, donde C es una constante independiente de n, entonces se dice que el cre- 
cimiento del error es lineal. 


e Si E, ~ C” Ej, para algunas С > 1, entonces el crecimiento del error recibe el nombre de 
exponencial. 0 


Normalmente, el crecimiento lineal del error es inevitable, y cuando Су Ey son peque- 
ñas, en general, los resultados son aceptables. El crecimiento exponencial del error debería 
evitarse porque el término C” se vuelve grande incluso para los valores relativamente pe- 
queños de n. Esto conduce a imprecisiones inaceptables, independientemente del tamaño de 
Eo. Como consecuencia, mientras un algoritmo que presenta crecimiento lineal del error es 
estable, un algoritmo que presenta crecimiento exponencial del error es inestable. (Consulte 
la figura 1.10.) 


Crecimiento exponencial del error inestable 
E, = С"Еу 


e Crecimiento lineal del error estable 
Е, = СпЕ, 


Para cualquier constante c1 y с, 


1 n 
Pn = СІ (5) + c23", (1.4) 


Tabla 1.5 
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es una solución a la ecuación recursiva 


10 


Рп = 3 Pn- — Pn-2, paran = A N эз 


Se puede observar que 


10 10 ү"! 9 
TFT Pn-1 7 Pn2= TT |С1 {5 + с23 


3 
Nr 
a 
1\72 /1 КЕ y , 
= с (5) (5) + с23" (9) = сі (5) + 023" = Pp. 


Suponga que tenemos ро = l y р = 1, Usando estos valores y la ecuación (1.4) podemos 

В РИ ` үп 
determinar valores únicos para las constantes су = 1 y c2 = 0. Por lo tanto, рп = (5) рага 
todas las л. 


Si se utiliza aritmética de redondeo de cinco dígitos para calcular los términos de la 
sucesión determinada por esta ecuación, entonces ро = 1.0000 y р = 0.33333, lo cual re- 
quiere la modificación de las constantes para 2; = 1.0000 y ĉ = —0.12500 х 1075. Así, la 
sucesión generada {, }2 у está dada por 


1 п 
Pn = 1.0000 (5) — 0.12500 х 10—5(3)", 


que tiene un error de redondeo, 
рп = În = 0.12500 х 10*(3"). 
Este procedimiento es inestable уа que el error aumenta exponencialmente соп п, lo cual se 


refleja en las imprecisiones extremas después de los primeros términos, como se muestra en 
la tabla 1.5. 


n P calculada P corregida Error relativo 
0 0.10000 x 10! 0.10000 x 10! 

1 0.33333 x 10% 0.33333 x 10% 

2 0.11110 x 10% 0.11111 x 100 9 x 107 
3 0.37000 x 107! 0.37037 x 107! 1х 107? 
4 0.12230 x 107! 0.12346 x 107! 9 x 107° 

5 0.37660 x 107? 0.41152 x 107? 8 x 107? 
6 0.32300 x 107° 0.13717 x 107? 8 x 107! 

7 —0.26893 x 107? 0.45725 x 107° 7х 100 

8 —0.92872 x 107? 0.15242 х 107° бх 10! 


Ahora considere esta ecuación recursiva: 
Pn =2Pn-1 = Pn-2, paran=2,3,.... 
Tiene la solución р, = cı + соп para cualquier constante cı y c2 porque 
P 


2Pn-1 = Рһ-2 = 2(c1 + ca(n = 1)) = (сі + ca(n = 2)) 
= c12 — 1) + (2n —2 -n +2) = с + cen = pr. 
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Tabla 1.6 


Definición 1.18 


Si tenemos Po = l y р = І, entonces las constantes еп esta ecuación se determinan 
exclusivamente сото cı = 1 y с = A Esto implica que p, = 1 — 2п. 

Si se utiliza aritmética de redondeo de cinco dígitos para calcular los términos de la 
sucesión provista por esta ecuación, entonces Po = 1.0000 y р = 0.33333. Como 
consecuencia, las constantes de redondeo de cinco dígitos son у = 1.0000 y ĉ = —0.66667. 


Por lo tanto, 
Pn = 1.0000 — 0.66667n, 


que tiene un error de redondeo 
Я 2 
Pn = În = | 0.66667 — 3 п. 


Este procedimiento es estable porque el error aumenta linealmente соп п, lo cual se refleja 


en las aproximaciones que se muestran en la tabla 1.6. ш 
п P calculada Pn corregida Error relativo 
0 0.10000 x 10! 0.10000 x 10 

1 0.33333 x 10% 0.33333 х 10° 

2 —0.33330 х 10° —0.33333 х 10° 9 х 1075 

3 —0.10000 x 10! —0.10000 х 10 0 

4 —0.16667 х 10! —0.16667 х 10 0 

Э —0.23334 х 10! —0.23333 х 10 4х 107 

6 —0.30000 x 10! —0.30000 x 10 0 

7 —0.36667 x 10! —0.36667 x 10 0 

8 —0.43334 х 10! —0.43333 х 10 2х 1075 


Los efectos del error de redondeo se pueden reducir con la aritmética de dígitos de orden 
superior, como la opción de precisión doble o múltiple disponible en muchas computadoras. 
Las desventajas de utilizar la aritmética de precisión doble son que requiere más tiempo de 
cálculo y el crecimiento del error de redondeo no se elimina por completo. 

Un enfoque para calcular el error de redondeo es usar la aritmética de intervalo (es decir, 
retener los valores más grande y más pequeño posibles), de esta forma, al final, obtenemos 
un intervalo que contiene el valor verdadero. Por desgracia, podría ser necesario un intervalo 
pequeño para la implementación razonable. 


Tasas de convergencia 


Puesto que con frecuencia se utilizan técnicas iterativas relacionadas con sucesiones, esta 
sección concluye con un análisis breve sobre la terminología que se usa para describir la 
rapidez con que ocurre la convergencia. En general, nos gustaría que la técnica converja tan 
rápido como sea posible. La siguiente definición se usa para comparar las tasas de conver- 
gencia de las sucesiones. 


Suponga que (8, );-, es una sucesión conocida que converge a cero y (0, }? у converge a un 
número а. Si existe una constante positiva К con 


|а, — 0] < К|ф„|, para una n grande, 


entonces decimos que {œn}; converge а а con una rapidez, u orden de convergencia 
O (Bn). (Esta expresión se lee “O de В,.) Se indica al escribir а, = e + O (bn). п 


Ejemplo 2 


Tabla 1.7 


Existen muchas otras formas 

de describir el crecimiento de 
las sucesiones y las funciones, 
algunas requieren límites tanto 
por encima como por debajo 

de la sucesión o función que 

se considera. Cualquier buen 
libro que analiza algoritmos, por 
ejemplo, [CLRS], incluiría esta 
información. 


Definición 1.19 
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A pesar de que la definición 1.18 permite comparar (0, );2., con una sucesión arbitraria 
{8.129 en casi todas las situaciones usamos 


para algún número p > O. En general, nos interesa el valor más grande de p con 
An = а + O(1/n?). 


Suponga que, paran > 1, 


п+ 1 К n+3 
An = a у An = š 
n2 n? 
aunque lím noo æn = 0 y lím p> Ên = 0, la sucesión {ĉn} converge a este límite mucho 


más rápido que la sucesión (a,,). Al usar la aritmética de redondeo de cinco dígitos, tenemos 
los valores que se muestran en la tabla 1.7. Determine la rapidez de convergencia para estas 
dos sucesiones. 


n 1 2 3 4 5 6 7 


An 2.00000 0.75000 0.44444 0.31250 0.24000 0.19444 0.16327 
й, 4.00000 0.62500 0.22222 0.10938 0.064000 0.041667 0.029155 


Solución Defina las sucesiones В, = 1/п y В, =1 /n?. Entonces 


1 1 
е a аш ота 
п п п 
y 
3 3 1 2 
6. -0= 22 «727. ар, 
п- n- n 


Por lo tanto, la rapidez de convergencia de (a,,) cero es similar a la convergencia de {1/7} 
a cero, mientras {ĉn} converge a сего con una rapidez similar para la sucesión que converge 
más rápido (1/n?). Expresamos esto al escribir 


1 1 
0 =0+0 () y 6 =0+0 (3). и 
п п 


También usamos la notación О (O grande) para describir la rapidez con la que conver- 
gen las funciones. 


Suponga que lím һо С(л) = 0 y ќт, 0 F (h) = L. Si existe una constante positiva К con 
|[F(h) — L| < К|С(Л)|, para h suficientemente pequeña, 


entonces escribimos F (h) = L + O(G(h)). ш 


En general, las funciones que utilizamos para comparar tienen la forma de С(Л) = hP, 
donde p > 0. Nos interesa el valor más grande de p, рага el que F (h) = L + О(АР). 
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à : Я 1 
Ејетріоз Use el tercer polinomio de Taylor alrededor de Л = 0 para mostrar que cos л + ¿e =1+ 
О(һ°). 


Solución Еп el ejemplo 3b) de la sección 1.1, vimos que este polinomio es 


h=1 p4 | h* cos (А) 
соѕй = 1 – – == cos А 
2 24 


рага algún número ¿(h) entre cero у h. Esto implica que 


hd И E(h) 
COS = = —A СОЅ * 
2 24 


Por lo tanto, 
piip 1 | E(h) ht < 1 р 
cos = = 1 = |— cos ==, 
о 24°° 2 24 


de modo que Л > 0, cos h + Л? converge a este límite, 1, tan rápido como h* converge а 
0. Es decir, 


1,2 _ 4 
cosh + zh =1 + O(h’). ш 


La sección Conjunto de ejercicios 1.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN f 1.4 Software numérico 


Los paquetes de software computacional para aproximar las soluciones numéricas a los pro- 
blemas en muchas formas. En nuestro sitio web para el libro 


https://sites.google.com/site/numericalanalysislburden/ 


proporcionamos programas escritos en C, FORTRAN, Maple, Mathematica, MATLAB y 
Pascal, así como applets de JAVA. Éstos se pueden utilizar para resolver los problemas pro- 
vistos en los ejemplos y ejercicios, y aportan resultados satisfactorios para muchos de los 
problemas que usted quizá necesite resolver. Sin embargo, son lo que llamamos programas 
de propósito especial. Nosotros usamos este término para distinguir estos programas de 
aquellos disponibles en las librerías de subrutinas matemáticas estándar. Los programas en 
estos paquetes recibirán el nombre de propósito general. 

Los programas en los paquetes de software de propósito general difieren es sus intencio- 
nes de los algoritmos y programas proporcionados en este libro. Los paquetes de software de 
propósito general consideran formas para reducir los errores debido al redondeo de máquina, 
el subdesbordamiento y el desbordamiento. También describen el rango de entrada que con- 
ducirá a los resultados con cierta precisión específica. Éstas son características dependientes 
de la máquina, por lo que los paquetes de software de propósito general utilizan parámetros 
que describen las características de punto flotante de la máquina que se usa para los cálculos. 


Ilustración Para ilustrar algunas diferencias entre los programas incluidos en un paquete de propósito 
general y un programa que nosotros proporcionaríamos en este libro, consideremos un al- 
goritmo que calcula la norma euclidiana de un vector n dimensional х = (хі, X2,... , х). А 
menudo, esta norma se requiere dentro de los programas más grandes y se define mediante 


1/2 
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La norma da una medida de la distancia del vector x y el vector 0. Por ejemplo, el vector 
x = (2,1,3, 2, 1) tiene 


ік = [2? + 1? +3? + (2)? + 0712 = v19, 


por lo que su distancia a partir de 0 = (0, 0, 0, 0, 0)' es y/19 ~ 4.36. 

Un algoritmo del tipo que presentaríamos para este problema se proporciona aquí. No 
incluye parámetros dependientes de máquina y no ofrece garantías de precisión, pero apor- 
tará resultados precisos “la mayor parte del tiempo”. 


ENTRADA n,x1,X2,... , Xp. 

SALIDA NORM. 

Paso 1 Haga SUM =0. 

Paso 2 Parai = 1,2,... ‚п determine SUM = SUM + x?. 
Paso З Determine NORM = SUM!??, 


Paso 4 SALIDA (NORM), 
PARE. ш 


Un programa con base en nuestro algoritmo es fácil de escribir y comprender. Sin embar- 
go, el programa no sería suficientemente preciso debido a diferentes razones. Por ejemplo, la 
magnitud de algunos números podría ser demasiado grande o pequeña para representarse con 
precisión en el sistema de punto flotante de la computadora. Además, este orden para reali- 
zar los cálculos quizá no produzca los resultados más precisos, o que la rutina para obtener 
la raíz cuadrada podría no ser la mejor disponible para el problema. Los diseñadores del 
algoritmo consideran asuntos de este tipo al escribir programas para software de propósito 
general. A menudo, estos programas contienen subprogramas para resolver problemas más 
amplios, por lo que deben incluir controles que nosotros no necesitaremos. 


Algoritmos de propósito general 


Ahora consideremos un algoritmo para un programa de software de propósito general para 
calcular la norma euclidiana. Primero, es posible que a pesar de que un componente х; del 
vector se encuentre dentro del rango de la máquina, el cuadrado del componente no lo esté. 
Esto se puede presentar cuando alguna |x;| es tan pequeña que x? causa subdesbordamiento o 
cuando alguna |x;| es tan grande que x? causa desbordamiento. 

También es posible que todos estos términos se encuentren dentro del rango de la má- 
quina, pero que ocurra desbordamiento a partir de la suma de un cuadrado de uno de los 
términos para la suma calculada previamente. 

Los criterios de precisión dependen de la máquina en la que se realizan los cálculos, por 
lo que los parámetros dependientes de la máquina se incorporan en el algoritmo. Suponga 
que trabajamos en una computadora hipotética con base 10, la cual tiene + > 4 dígitos de 
precisión, un exponente mínimo emín y un exponente máximo emáx. Entonces el conjunto 
de números de punto flotante en esta máquina consiste en 0 y los números de la forma 


х= 10°, donde ў = (А107 + p107 +--+ 107), 


donde 1 < fı < 9 y0 < f; < 9, para cada i = 2, ...,t, y donde етіп < e < emáx. Estas 
restricciones implican que el número positivo más pequeño representado en la máquina es 
o = 10°"""—1, por lo que cualquier número calculado x con |х| < о causa subdesbordamien- 
to y que x sea 0. El número positivo más grande es А = (1 — 107*)10%"4x y cualquier 
número calculado x con |х| > A causa desbordamiento. Cuando se presenta subdesborda- 
miento, el programa continuará, a menudo, sin una pérdida significativa de precisión. Si se 
presenta desbordamiento, el programa fallará. 
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CAPÍTULO 1 


= Preliminares matemáticos y análisis de error 


El algoritmo supone que las características de punto flotante de la máquina se describen 
a través de los parámetros N, s, S, y y Y. El número máximo de entradas que se pueden sumar 
соп por lo menos 1/2 dígitos de precisión está provisto por N. Esto implica que el algoritmo 
procederá a encontrar la norma de un vector x = (x1, X2,... , Xn} sólo sin < N. Para resolver 
el problema de subdesbordamiento-desbordamiento, los números de punto flotante distintos 
a cero se dividen en tres grupos: 


+ números de magnitud pequeña x, aquellos que satisfacen 0 < |x| < у; 
• números de magnitud media x, donde у < |х| < Y; 


+ números de magnitud grande x, donde Y < |х|. 


Los parámetros y y Y se seleccionan con el fin de evitar el problema de subdesbor- 
damiento-desbordamiento al sumar y elevar al cuadrado los números de magnitud media. 
Elevar al cuadrado los números de magnitud pequeña puede causar subdesbordamiento, por 
lo que se utiliza un factor de escala $ mucho mayor a 1 con el resultado (sx)? que evita el 
subdesbordamiento incluso cuando x? no lo hace. Sumar y elevar al cuadrado los números 
que tienen una magnitud grande puede causar desbordamiento. Por lo que, en este caso, se 
utiliza un factor de escala positivo s mucho menor a 1 para garantizar que (sx)? no cause 
desbordamiento al calcularlo o incluirlo en una suma, a pesar de que х2 lo haría. 

Para evitar escalamiento innecesario, y y Y se seleccionan de tal forma que el rango de 
números de magnitud media sea tan largo como sea posible. El siguiente algoritmo es una mo- 
dificación del que se describe en [Brow, W], p. 471. Éste incluye un procedimiento para sumar 
los componentes escalados del vector, que son de magnitud pequeña hasta encontrar un com- 
ponente de magnitud media. Entonces se elimina la escala de la suma previa y continúa al ele- 
var al cuadrado y sumar los números pequeños y medianos hasta encontrar un componente con 
una magnitud grande. Una vez que el componente con magnitud grande aparece, el algoritmo 
escala la suma anterior y procede a escalar, elevar al cuadrado y sumar los números restantes. 

El algoritmo supone que, en la transición desde números pequeños a medianos, los nú- 
meros pequeños no escalados son despreciables, al compararlos con números medianos. De 
igual forma, en la transición desde números medianos a grandes, los números medianos no 
escalados son despreciables, al compararlos con números grandes. Por lo tanto, las seleccio- 
nes de los parámetros de escalamiento se deben realizar de tal forma que se igualen a O sólo 
cuando son verdaderamente despreciables. Las relaciones comunes entre las características 
de máquina, como se describen en ї, о, А, етіп y emáx y los parámetros del algoritmo N, 5, 
S, y y Y se determinan después del algoritmo. 

El algoritmo usa tres indicadores para señalar las diferentes etapas en el proceso de 
suma. Estos indicadores son valores iniciales determinados en el paso 3 del algoritmo. FLAG 
(BANDERA) 1 es 1 hasta encontrar un componente mediano o grande; entonces se convierte 
en 0. FLAG (BANDERA) 2 es 0 mientras se suman números pequeños, cambia a 1 cuando 
se encuentra un número mediano por primera vez, y regresa a 0 cuando se encuentra un nú- 
mero grande. Inicialmente, FLAG (BANDERA) 3 es 0 y cambia a 1 cuando se encuentra un 
número grande por primera vez. El paso 3 también introduce el indicador DONE (HECHO), 
que es O hasta que se terminan los cálculos y, entonces, regresa a 1. 


ENTRADA N,s,S,y,Y,A,N,X],X2,... , Xp» 


SALIDA NORM o un mensaje de error apropiado. 


Paso 1 Si n < 0 entonces SALIDA (“El entero n debe ser positivo.”) 


PARE. 


Paso 2 Si п > N entonces SALIDA (“El entero n es demasiado grande.”) 


PARE. 
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Paso З Determine SUM = 0; 
FLAG = 1; (Se suman los números pequeños.) 


FLAG2 = 0; 
FLAG3 =0; 
DONE = 0; 
үз]; 


Paso 4 Mientras (i < n y FLAG1 = 1) haga el paso 5. 


Paso 5 Si |х;| < y entonces determine SUM = SUM +(Sx;)?; 
i=i+1 
también determine FLAG1 = 0. (Se encuentra un número no pequeño.) 


Paso 6 Sii > п entonces determine NORM = (SUM)! /S; 


DONE = 1 
también determine SUM = (SUM/S)/S;  (Escalamiento de números grandes.) 
FLAG? = 1. 


Paso 7 Mientras (i < п y FLAG2 = 1) haga el paso 8. (Se suman los números medianos.) 
Paso 8 $1 |х;| < Y entonces determine SUM = SUM + х2 
i=i+1 
también determine FLAG2 = 0. (Se encuentra un número no grande.) 
Paso 9 Si DONE = 0 entonces 
sii > п entonces determine NORM = (SUM)!??; 


DONE = 1 
también determine SUM = ((SUM)s)s; (Escalamiento de números grandes.) 
FLAG3 = 1. 


Paso 10 Mientras і < n y FLAG3 = 1) haga el paso 11. 
Paso 11 Determine SUM = SUM +(sx;)?; (Sume los números grandes.) 
і=і +1. 


Paso 12 Si DONE = 0 entonces 
si SUM!/? < Аз entonces determine NORM = (SUM)! /s; 
DONE = 1 
también determine SUM = А. (La norma es demasiado grande.) 


Paso 13 Si DONE = 1 entonces SALIDA (‘Norma es”, NORM) 
también SALIDA (“Norma >’, NORM, 'ocurrió sobreflujo'). 


Paso 14 PARE. 


Las relaciones entre las características de máquina /, о, А, етіп y emáx y los parámetros 
del algoritmo N, s, 5, y y Y se seleccionaron en [Brow, W], р. 471, сото 


№ = 10%, donde ey = |(t — 2)/2], El entero más grande menor o igual a 
(t — 2)/2; 
s =10%, donde е, = |—(emáx + ey)/2]; 


S = 10%, donde es = [(1 — emín)/2], El entero más pequeño mayor o igual 


La primera computadora portátil 
fue la Osborne I, producida en 
1981, a pesar de que era mucho 
más grande y pesada de lo que 
podríamos pensar como portátil. 


que (1 — emín)/2; 
y = 10°, donde еу = [(emín + t — 2)/2]; 
Y = 10%, donde ey = |(emáx — ey)/2]. 
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El sistema FORTRAN (FORmula 
TRANslator) fue el lenguaje 

de programación científica de 
propósito general original. 

Sigue utilizándose ampliamente 
en situaciones que requieren 
cálculos científicos intensivos. 


El proyecto EISPACK fue el 
primer paquete de software 
numérico a gran escala en estar 
disponible para dominio público 
y lideró el camino para que 
muchos paquetes lo siguieran. 


La ingeniería de software se 
estableció como disciplina de 
laboratorio durante las décadas 
de 1970 y 1980. EISPACK se 
desarrolló en Argonne Labs 

y LINPACK poco después. A 
principios de la década de 1980, 
Argonne fue reconocido en el 
ámbito internacional como líder 
mundial en cálculos simbólicos y 
numéricos. 


En 1970, IMSL se convirtió en 
la primera librería científica a 
gran escala para computadoras 
centrales. Ya que en esa época, 
existían librerías para sistemas 
computacionales que iban 
desde supercomputadoras hasta 
computadoras personales. 


= Preliminares matemáticos y análisis de error 


La fiabilidad construida en este algoritmo ha incrementado ampliamente la complejidad, en 
comparación con el algoritmo provisto antes en esta sección. En la mayoría de los casos, 
los algoritmos de propósito especial y general proporcionan resultados idénticos. La ventaja 
del algoritmo de propósito general es que proporciona seguridad para sus resultados. 

Existen muchas formas de software numérico de propósito general disponibles en el ám- 
bito comercial y en el dominio público. La mayor parte de los primeros se escribió para las 
computadoras centrales, y una buena referencia es Sources and Development of Mathematical 
Software (Fuentes y desarrollo de software matemático), editado por Wayne Cowell [Co]. 

Ahora que las computadoras personales son suficientemente poderosas, existe software 
numérico estándar para ellas. La mayoría de este software numérico se escribe en FOR- 
TRAN, a pesar de que algunos están escritos en С, C++ y FORTRANDOO. 

Los procedimientos ALGOL se presentaron para cálculos de matrices en 1971 en [WR]. 
Después, se desarrolló un paquete de subrutinas FORTRAN con base principalmente en los 
procedimientos ALGOL dentro de las rutinas EISPACK. Estas rutinas se documentan en 
los manuales publicados por Springer-Verlag como parte de sus Lecture Notes (Notas de 
clase) en la serie Computer Science (Ciencias computacionales) [Sm, B] y [Gar]. Las subru- 
tinas FORTRAN se utilizan para calcular los valores propios y los vectores propios para una 
variedad de diferentes tipos de matrices. 

LINPACK es un paquete de subrutinas FORTRAN para analizar y resolver sistemas de 
ecuaciones lineales y resolver problemas de mínimos cuadrados lineales. La documentación 
en este paquete se encuentra en [DBMS]. Una introducción paso a paso para LINPACK, 
EISPACK y BLAS (Basic Linear Algebra Subprograms; Subprogramas de Álgebra Lineal 
Básica) se proporciona en [CV]. 

El paquete LAPACK, disponible por primera vez en 1992, es una librería de las subruti- 
nas FORTRAN que sustituyen a LINPACK y EISPACK al integrar estos dos conjuntos de al- 
goritmos en un paquete unificado y actualizado. El software se ha reestructurado para lograr 
mayor eficiencia en procesadores de vectores y otros multiprocesadores de alto desempeño 
y memoria compartida. LAPACK se expande en profundidad y amplitud en la versión 3.0, 
disponible en FORTRAN, FORTRANDO, С, C++ y JAVA. С y JAVA sólo están disponibles 
como interfaces de idioma o traducciones de las librerías FORTRAN de LAPACK. El paque- 
te BLAS no forma parte de LAPACK, pero el código para BLAS se distribuye con LAPACK 

Otros paquetes para resolver tipos específicos de problemas están disponibles en el do- 
minio público. Como alternativa para netlib, puede utilizar Xnetlib para buscar en la base de 
datos y recuperar software. Encuentre más información en el artículo Software Distribution 
Using Netlib de Dongarra Roman y Wade [DRW]. 

Estos paquetes de software son muy eficientes, precisos y confiables. Se prueban de ma- 
nera meticulosa y la documentación está disponible fácilmente. A pesar de que los paquetes 
son portátiles, es una buena idea investigar la dependencia de la máquina y leer la documen- 
tación con todo detalle. Los programas prueban casi todas las contingencias especiales que 
podrían resultar en errores o fallas. Al final de cada capítulo analizaremos algunos de los 
paquetes de propósito general adecuados. 

Los paquetes comercialmente disponibles también representan los métodos numéricos 
de vanguardia. A menudo, su contenido está basado en los paquetes de dominio público, pero 
incluyen métodos en bibliotecas para casi cualquier tipo de problemas. 

Las IMSL (International Mathematical and Statistical Libraries; Bibliotecas Estadísticas 
y Matemáticas Internacionales) están formadas por bibliotecas MATH, STAT y SFUN para 
matemáticas numéricas, estadísticas y funciones especiales, respectivamente. Estas bibliote- 
cas contienen más de 900 subrutinas originalmente disponibles en FOR-TRAN 77 y ahora 
disponibles en С, FORTRANDOO y JAVA. Estas subrutinas resuelven los problemas de análisis 
numéricos más comunes. Las librerías están comercialmente disponibles en Visual Numerics. 

Los paquetes se entregan en formato compilado con documentación amplia. Existe un 
programa de ejemplo para cada rutina, así como información de referencia de fondo. IMSL 
contiene métodos para sistemas lineales, análisis de sistemas propios, interpolación y apro- 
ximación, integración y diferenciación, ecuaciones diferenciales, transformadas, ecuaciones 
no lineales, optimización y operaciones básicas matriz/vector. La biblioteca también incluye 
amplias rutinas estadísticas. 


El Numerical Algorithms Group 
(NAG) se fundó en Reino 
Unido en 1971 y desarrolló la 
primera biblioteca de software 
matemático. Actualmente 

tiene más de 10000 usuarios 

a nivel mundial y contiene 

más de 1000 funciones 
matemáticas y estadísticas 

que van desde software de 
simulación estadística, simbólica, 
visualización y numérica hasta 
compiladores y herramientas de 
desarrollo de aplicaciones. 


Originalmente, MATLAB se 
escribió para proporcionar 
acceso al software de matriz 
desarrollado en proyectos 
LINPACK y EISPACK. La 
primera versión se escribió a 
finales de la década de 1970 para 
utilizarse en cursos de teoría de 
matriz, álgebra lineal y análisis 
numérico. Actualmente, existen 
más de 500000 usuarios de 
MATLAB en más de 100 países. 


Las rutinas NAG son 
compatibles con Maple, desde la 
versión 9.0. 
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El Numerical Algorithms Group (NAG; Grupo de Algoritmos Numéricos) ha existido 
en Reino Unido desde 1970. NAG ofrece más de 1000 subrutinas en una biblioteca FOR- 
TRAN 77, aproximadamente 400 subrutinas en una biblioteca C, más de 200 subrutinas en 
una biblioteca FORTRAN 90 y una biblioteca MPI FORTRAN para máquinas paralelas y 
agrupaciones de estaciones de trabajo o computadoras personales. Una introducción útil para 
las rutinas NAG es [Ph]. La biblioteca NAG contiene rutinas para realizar la mayor parte 
de las tareas de análisis numérico estándar de manera similar a la de IMSL. También incluye 
algunas rutinas estadísticas y un conjunto de rutinas gráficas. 

Los paquetes IMSL y NAG están diseñados para los matemáticos, científicos o ingenie- 
ros que desean llamar subrutinas de alta calidad de C, Java o FORTRAN desde dentro de un 
programa. La documentación disponible con los paquetes comerciales ilustra el programa 
activador común, requerido para utilizar las rutinas de la librería. Los siguientes tres paque- 
tes de software son ambientes autónomos. Cuando se activan, los usuarios introducen co- 
mandos para hacer que el paquete resuelva un problema. Sin embargo, cada paquete permite 
programar dentro del lenguaje de comando. 

MATLAB es una matriz de laboratorio que, originalmente, era un programa Fortran 
publicado por Cleve Moler [Mo] en la década de 1980. El laboratorio está basado princi- 
palmente en las subrutinas EISPACK y LINPACK, a pesar de que se han integrado fun- 
ciones, como sistemas no lineales, integración numérica, splines cúbicos, ajuste de curvas, 
optimización, ecuaciones diferenciales normales y herramientas gráficas. Actualmente, 
MATLAB está escrito en С y lenguaje ensamblador y la versión para PC de este paquete 
requiere un coprocesador numérico. La estructura básica es realizar operaciones de matriz, 
como encontrar los valores propios de una matriz introducida desde la línea de comando o 
desde un archivo externo a través de llamadas a funciones. Éste es un sistema autónomo 
poderoso que es especialmente útil para instrucción en un curso de álgebra lineal aplicada. 

El segundo paquete es GAUSS, un sistema matemático y estadístico producido por Lee 
E. Ediefson y Samuel D. Jones en 1985. Está codificado principalmente en lenguaje en- 
samblador y basado EISPACK y LINPACK. Al igual que en el caso de MATLAB, existe 
integración/diferenciación, sistemas no lineales, transformadas rápidas de Fourier y gráficas. 
GAUSS se orienta menos hacia la enseñanza de álgebra lineal y más hacia el análisis esta- 
dístico de datos. Este paquete también utiliza un coprocesador numérico, cuando existe uno. 

El tercer paquete es Maple, un sistema de álgebra computacional desarrollado en 1980 
Mediante el Symbolic Computational Group (Grupo Computacional Simbólico) en la Uni- 
versity of Waterloo. El diseño para el sistema original Maple se presenta en el artículo de 
B.W. Char, К.О. Geddes, W.M. Gentlemen y G.H. Gonnet [CGGG|]. 

Maple, escrito en C, tiene la capacidad de manipular información de manera simbóli- 
ca. Esta manipulación simbólica permite al usuario obtener respuestas exactas, en lugar de 
valores numéricos. Maple puede proporcionar respuestas exactas a problemas matemáticos 
como integrales, ecuaciones diferenciales y sistemas lineales. Contiene una estructura de 
programación y permite texto, así como comandos, para guardarlos en sus archivos de hojas 
de trabajo. Estas hojas de trabajo se pueden cargar a Maple y ejecutar los comandos. 

El igualmente popular Mathematica, liberado en 1988, es similar a Maple. 

Existen numerosos paquetes que se pueden clasificar como paquetes de supercalculadora 
para la PC. Sin embargo, éstos no deberían confundirse con el software de propósito general 
que se ha mencionado aquí. Si está interesado en uno de estos paquetes, debería leer Super- 
calculators оп the PC (Supercalculadoras en Іа PC) de B. Simon y К. М. Wilson [SW]. 

Información adicional sobre el software y las bibliotecas de software se puede encontrar 
en los libros de Cody y Waite [CW] y de Kockler [Ko] y el artículo de 1993 de Dongarra 
y Walker [DW]. Más información sobre cálculo de punto flotante se puede encontrar en el 
libro de Chaitini-Chatelin y Frayse [CF] y el artículo de Goldberg [Go]. 

Los libros que abordan la aplicación de técnicas numéricas sobre computadoras para- 
lelas incluyen los de Schendell [Sche], Phillips and Freeman [PF] y Golub y Ortega [GO]. 


Las secciones Pregunta de análisis, Conceptos clave y Revisión del capítulo están dispo- 
nibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Soluciones de las ecuaciones en una variable 


Introducción 


A menudo, el crecimiento de una población se puede modelar sobre periodos breves al asu- 
mir que aumenta de manera continua con el tiempo a una tasa proporcional al número actual 
en ese momento. Suponga que N(t) denota el número en la población en el tiempo гу» 
denota la tasa constante de natalidad. Entonces, dicha población satisface la ecuación dife- 
rencial 


dN(t) 
dt 


=N (t), 
cuya solución es N (t) = Nọe™ donde No denota la población inicial. 


NO А 


3000 + 


2000 У NAN) = 1000е^ 


1564 
1435 


Población (miles) 


1000 + 


>y 


Índice de natalidad 


Este modelo exponencial sólo es válido cuando la población está aislada, sin inmigra- 
ción. Si se permite inmigración a una tasa constante v, entonces la ecuación diferencial se 
convierte en 

dN (t) 
dt 


=AN(t)+v, 
cuya solución es 
N (t) = Ме! + е” =, 


35 
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Suponga que, en un inicio, cierta población contiene N(0) = 1000000 individuos, que 
435000 individuos inmigran a la comunidad durante el primer año y que existen N(1) = 
1564000 individuos al final del año. Para determinar la natalidad de esta población, necesi- 
tamos encontrar А en la ecuación 


435000 
1564 000 = 1000000e* + = e — 1). 


En esta ecuación no es posible resolver de manera explícita para à, pero los métodos 
numéricos que se analizan en este capítulo se pueden utilizar para aproximar las solu- 
ciones de las ecuaciones de este tipo con una precisión arbitrariamente alta. Las solución a 
este problema particular se considera en el ejercicio 22 de la sección 2.3. 


ж 2.1 El método de bisección 


En este capítulo consideramos uno de los problemas básicos de la aproximación numérica, el 
problema de la búsqueda de la raíz. Este proceso implica encontrar una raíz, o solución, 
para una ecuación de la forma f(x) = 0, para una función f dada. Una raíz de esta ecuación 
también recibe el nombre de cero de la función f. 

El problema de encontrar una aproximación para la raíz de una ecuación se puede ras- 
trear por lo menos al año 1700 a.C. Una tabla cuneiforme en la Colección Babilónica de Yale 
que data del periodo provee un número sexagesimal (base 60) equivalente a 1.414222 como 
una aproximación рага /2, un resultado que es preciso dentro de 107°. Esta aproximación 
se puede encontrar al aplicar una técnica descrita en el ejercicio 19 de la sección 2.2. 


Técnica de bisección 


En las ciencias computacionales, [а primera técnica, basada en el teorema de valor intermedio, recibe el nombre de bisección, 
е 988 н онен dividir о método de búsqueda binaria. 
a la mitad un conjunto de manera dá . * А 
боша pará buscar da solución Suponga que fes una función continua definida dentro del intervalo [а, b] con f(a) у f(b) 
de un problema, como lo hace de signos opuestos. El teorema de valor intermedio implica que existe un número p en (a, 
el método de bisección, se le b) con f(p) = 0. A pesar de que el procedimiento operará cuando haya más de una raíz en el 
conoce como procedimiento de intervalo (a, b), para simplicidad, nosotros asumimos que la raíz en este intervalo es única. 
búsqueda binaria. Я А 2 ia А ; > А 
El método realiza repetidamente una reducción а la mitad (o bisección) de los subintervalos 
de [a, b] y, en cada paso, localizar la mitad que contiene p. 


Para comenzar, sea ај = ay bı = b y sea ру es el punto medio de [a, b], es decir, 


bi=a а +b 
E Е LE = L 


e Si f(pı) = 0, entonces p = p; y terminamos. 

e Si f (pı) = 0, entonces f(p;) tiene el mismo signo que ya sea f(a¡) o (Рі). 
o Si f(pı) y f(aı) tienen el mismo signo, p € (р, b,). Sea а, = ру = bı. 
o Sif(pı) y (а) tienen signos opuestos, p € (a, р). Sea a, = ау b = рі. 


Entonces, volvemos а aplicar el proceso al intervalo [а›, b2]. Esto produce el método descrito 
en el algoritmo 2.1 (consulte la figura 2.1). 
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Figura 2.1 


Bisección 


Para encontrar una solución a f(x) = 0 dada la función continua determinada fen el intervalo 
[a, b], donde f(a) y f(b) tienen signos opuestos: 


ENTRADA puntos finales а, b; tolerancia TOL; número máximo de iteraciones No. 
SALIDA solución aproximada p o mensaje de falla. 


Paso 1 Seai= 1; 
FA = f(a). 


Paso 2 Mientras i < No haga los pasos 3-6. 


Paso 3 Seap =a + (b – а)/2; (Calcule р) 
FP = f(p). 
Paso 4 Si FP =Q o (b — а)/2 < TOL entonces 
SALIDA (p), (Procedimiento completado exitosamente.) 
PARE. 


Paso 5 Ѕеаі = і + 1. 


Paso 6 Si ЕА . ЕР > 0 entonces determine а = р; (Calcule a;i, bi.) 
ЕА = ЕР 
también determine b = р. (FA no cambia.) 


Paso 7 SALIDA (“El método fracasó después de Ny iteraciones, No =”, No); 
(El procedimiento no fue exitoso.) 
PARE. 


Se pueden aplicar otros procedimientos de parada en el paso 4 del algoritmo 2.1 o en 
cualquier técnica iterativa en este capítulo. Por ejemplo, podemos seleccionar una tolerancia 
€ > 0 y generar pı, ..., py hasta que se cumpla una de las siguientes condiciones: 
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Ejemplo 1 


|р = Py-1| < €, (2.1) 
low — Pral <e, ру+0, о (2.2) 
[рм| 
If (рм)| < є. (2.3) 


Рог desgracia, se pueden presentar dificultades al utilizar cualquiera de estos criterios 
de parada. Por ejemplo, existen sucesiones {Рл}; con la propiedad de que las diferencias 
Pn — Pn-1 convergen a cero mientras la sucesión misma diverge (consulte el ejercicio 19). 
También es posible que f(p,) esté cerca de cero mientras р, difiere significativamente de p 
(consulte el ejercicio 20). Sin conocimiento adicional sobre f o р, la desigualdad (2.2) es el 
mejor criterio de parada que se puede aplicar porque verifica el error relativo. 

Al utilizar una computadora para generar aproximaciones, es bueno practicar la confi- 
guración de un límite superior sobre el número de iteraciones. Esto elimina la posibilidad 
de entrar en un ciclo infinito, una situación que puede surgir cuando la sucesión diverge (y 
también cuando el programa se codifica de manera incorrecta). Eso se realizó en el paso 2 
del algoritmo 2.1, donde se estableció el límite N, y se concluyó el procedimiento si i > N, 

Observe que para iniciar el algoritmo de bisección, se debe encontrar un intervalo [a, b] 
con fía) · f(b) < 0. En cada paso, la longitud del intervalo conocida por contener un cero de 
/ ве reduce en un factor de 2; por lo tanto, es ventajoso elegir el intervalo inicial [a, b] tan 
pequeño como sea posible. Por ejemplo, si f(x) = 2x? — х? + x — 1, tenemos 


РОО y /0)./0)<0, 


por lo que el algoritmo de bisección se puede usar en [—4, 4] o en [0, 1]. Al iniciar el algo- 
ritmo de bisección еп [0, 1] en lugar de [—4, 4] reduciremos en 3 el número de iteraciones 
requerido para alcanzar una precisión específica. 

El siguiente ejemplo ilustra el algoritmo de bisección. La iteración en este ejemplo ter- 
mina cuando una cota para el error relativo es menor a 0.0001. Esto se garantiza al tener 


-P-P шуа 

mín(|a,|, |bnl} 
Muestre que f(x) = х? +4x? — 10 = 0 tiene una raíz en [1, 2] y utilice el método de bi- 
sección para determinar una aproximación para la raíz que sea precisa por lo menos dentro 
de 107. 


Solución Puesto que /(1) = —5 y /(2) = 14, el teorema de valor intermedio 1.11 ga- 
rantiza que esta función continua tenga una raíz en [1, 2]. 

Para la primera iteración del método de bisección, usamos el hecho de que en el punto 
medio de [1, 2] tenemos /(1.5) = 2.375 > 0. Esto indica que deberíamos seleccionar el in- 
tervalo [1, 1.5] para nuestra segunda iteración. А continuación, encontramos que f(1.25) = 
— 1.796875, por lo que nuestro intervalo se vuelve [1.25, 1.5], cuyo punto medio es 1.375. Si 
continuamos de esta forma, obtenemos los valores en la tabla 2.1. 

Después de 13 iteraciones, рз = 1.365112305 se aproxima а la raíz р con un error 


Ip = pi3| < lb14 — aja] = 11.365234375 — 1.365112305| = 0.000122070. 
Ya que |а14| < |p|, tenemos 


Ip= pi3| lb14—axal 
<= 


<90x 107, 
р [а14| 


Tabla 2.1 


Teorema 2.1 
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п аһ bn Pn f (Pn) 
1 1.0 2.0 1.5 2.375 
2 1.0 1.5 1.25 —1.79687 
3 1.25 1.5 1.375 0.16211 
4 1.25 1.375 1.3125 —0.84839 
3 1.3125 1.375 1.34375 —0.35098 
6 1.34375 1.375 1.359375 —0.09641 
7 1.359375 1.375 1.3671875 0.03236 
8 1.359375 1.3671875 1.36328125 —0.03215 
9 1.36328125 1.3671875 1.365234375 0.000072 
10 1.36328125 1.365234375 1.364257813 —0.01605 
11 1.364257813 1.365234375 1.364746094 — 0.00799 
12 1.364746094 1.365234375 1.364990235 —0.00396 
13 1.364990235 1.365234375 1.365112305 —0.00194 


de modo que la aproximación es correcta por lo menos dentro de 107“. El valor correcto de р 
para nueve lugares decimales es р = 1. 365230013. Observe que p, está más cerca de р que es 
la aproximación final рз. Se podría sospechar que esto es verdad porque | f (pọ)| < |f (p13)l, 
pero no podemos asegurarlo a menos que conozcamos la respuesta verdadera. п 


El método de bisección, a pesar de que está conceptualmente claro, tiene desventajas 
significativas. Su velocidad de convergencia es más lenta (es decir, N se puede volver bastan- 
te grande antes de que |р — py| sea suficientemente pequeña) y se podría descartar inadver- 
tidamente una buena aproximación intermedia. Sin embargo, el método tiene la importante 
propiedad de que siempre converge a una solución y por esta razón con frecuencia se utiliza 
como iniciador para los métodos más eficientes que veremos más adelante en este capítulo. 


Suponga que f є Cla, b] y f(a)- f(b) < 0. El método de bisección genera una sucesión 
{Pn}; que se aproxima a сего р de f con 


b= 


a 
[рь = pl < T’ cuando л> 1. 


Demostración Para сада п > 1, se tiene 


1 


bn — an = „—үф—а) y pE€(an,b). 


Ya que р, = 2 (а, + bn) para toda n > 1, se sigue que 


1 b= 
рь = p| < 7 On аһ) = = ш 


porque 
n = a > 
т 2" 


оо 


4 * Li : 
n=] converge en р con una razon de convergencia O (==); es decir 


1 
„== О (= |. 
m=p+0(3) 


Es importante señalar que el teorema 2.1 sólo provee una cota para el error de aproxima- 
ción y que ésta podría ser bastante conservadora. Por ejemplo, cuando se aplica al problema 


la sucesión {pn} 
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Ejemplo 2 


La palabra en latín signum 
significa “señal” o “signo”. Por 
lo que la función signum retorna 
de forma bastante natural el 
signo de un número (a menos que 
el número sea cero). 


en el ejemplo 1 sólo garantiza que 


lp — pol < == %2x 10%, 


pero el error real es mucho menor: 
|р — pol = |1.365230013 — 1.365234375| ~ 4.4 х 107°. 


Determine el número de iteraciones necesarias para resolver f(x) = х? + 4x? — 10 = 0 
con precisión de 107° mediante a; = 1 y bı = 2. 


Solución Usaremos logaritmos para encontrar un entero N que satisface 
lpy=pl<2"(b-a)=2" < 107. 
Los logaritmos para cualquier base bastarían, pero usaremos logaritmos base 10 porque la 


tolerancia se determina como una potencia de 10. Ya que 27“ < 107° implica que 1091027“ 
< 10910 107? = —3, tenemos 


= 9.96. 


– №1092 < -3 N > 
810 y 10810 2 


Por lo tanto, se requieren 10 iteraciones рага una aproximación precisa dentro de 107°. 

La tabla 2.1 muestra que el valor de pọ = 1.365234375 es exacto dentro de 1074. De 
nuevo, es importante considerar que el análisis de error sólo proporciona una cota para el nú- 
mero de iteraciones. En muchos casos, la cota es mucho mayor que el número real requerido. 

E 


La cota para el número de iteraciones en el método de bisección supone que los cálculos 
se realizan con aritmética de dígitos infinitos. Al implementar el método en una compu- 
tadora, necesitamos considerar los efectos del error de redondeo. Por ejemplo, el cálculo del 
punto medio del intervalo [а,, b,] se debería encontrar a partir de la ecuación 


bn — an 


аһ + ba 
Р» = а + == en lugar de p, = ——. 


2 


La primera ecuación añade una pequeña corrección, (р, — a,)/2, al valor conocido а„. Cuan- 
do р, — a, está cerca de la precisión máxima de la máquina, esta corrección podría ser un 
error, pero el error no afectaría significativamente el valor calculado de р. Sin embargo, es 
posible que (№, = a,)/2 regrese a un punto medio que no se encuentra dentro del intervalo 
[аъ Bn). 

Como observación final, para determinar el subintervalo de [a,, b,] contiene una raíz de 
f, es mejor utilizar la función signum, que se define como 


—1, 8х < 0, 
sgn(x) = 3 0, six = 0, 


T; six > 0. 


Utilizar 


sgn (f (an)) sgn (f(pn)) < 0 en lugar de Flan) f (Pn) < 0 


nos da el mismo resultado, pero evita la posibilidad de desbordamiento o subdesbordamiento 
en la multiplicación de f(an) y р»). 


La sección Conjunto de ejercicios 2.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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P 2.2 Iteración de punto fijo 


Un punto fijo para una función es un número en el que el valor de la función no cambia 
cuando se aplica la función. 


Definición 2.2 El número p es un punto fijo para una función dada g si g(p) = p. ш 


En esta sección, consideramos el problema de encontrar soluciones para los problemas 
de punto fijo y la conexión entre los problemas de punto fijo y aquellos para encontrar la raíz 
Los resultados de punto fijo que queremos resolver. Los problemas para encontrar la raíz y los de punto fijo son clases 


ocurren en muchas áreas de equivalentes en el siguiente sentido: 
las matemáticas y son una 


herramienta principal de los P А A 
т К e Dado un problema para encontrar la raíz (р) = 0, podemos definir las funciones g con un 
economistas para proporcionar 


resultados concernientes a los punto fijo en p en diferentes formas, por ejemplo, 


equilibrios. Aunque la idea 

detrás de la técnica es antigua, la 

terminología fue usada primero g&) =x- fx) о g(a)=x+3f(x). 
por el matemático holandés L. 

E. J. Brouwer (1882-1962) a 


principios de 1900. В is A a 22 : 
e Por otra parte, si la función g tiene un punto fijo en p, entonces la función definida por 


f(x) =x — g(x) 


tiene un cero en p. 


A pesar de que los problemas que queremos resolver se encuentran en la forma para 
encontrar la raíz, la forma de punto fijo es más fácil de analizar y ciertas elecciones de punto 
fijo conducen a técnicas muy poderosas para encontrar la raíz. 

Primero necesitamos estar cómodos con este nuevo tipo de problema y decidir cuándo 
una función tiene un punto fijo y cómo se pueden aproximar los puntos fijos dentro de una 
precisión especificada. 


Ejemplo 1 Determine cualquier punto fijo de la función g(x) = x? — 2. 


Solución Un punto fijo p para g tiene la propiedad de que 


р = &(р) = р – 2, lo cual implica que 0= p?— р- 2 = (p + 1)(р – 2). 


Un punto fijo para g ocurre precisamente cuando la gráfica de y = g(x) interseca la gráfica 
de y = x, por lo que g tiene dos puntos fijos, uno en p = —1 y el otro en p = 2. Éstos se 
muestran en la figura 2.2. п 
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Figura 2.2 
El siguiente teorema proporciona suficientes condiciones para la existencia y unicidad 
de un punto fijo. 
Teorema 2.3 i) Sig € Cla, b] y g(x) € la, b] para todas x € [a, b], entonces g tiene por lo menos un 
punto fijo en [a, b]. 
ii) Si, además, g'(x) existe en (a, b) y hay una constante positiva k < 1 con 
[2'(х)| <k, рага todas las x € (а, b), 
entonces, existe exactamente un punto fijo en [a, b]. (Véase la figura 2.3) 
Figura 2.3 


Demostración 


i) Si g(a) = ao g(b) = b, entonces g tiene un punto fijo en un extremo. De lo contrario, 
entonces g(a) > a y g(b) < b. La función h(x) = g(x) — x es continua en [a, b], con 


h(a)=g(a)-a>0 y А) = (6) –Ь <0. 
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El teorema de valor intermedio implica que existe р € (a, b) para la cual h(p) = 0. 
Este número p es un punto fijo para g porque 


О=Л(р) = 8(р)— р implicaque g(p)= р. 


ii) Suponga, además, que |g'(x)| <k < 1 y que р y q son puntos fijos en [a, b]. Si 
р + q, entonces el teorema de valor medio implica que existe un número ё entre р 
y q y por lo tanto en [a, b] con 


&(р) — 804) = 86). 
р-9 


Por lo tanto 


|р —ql=1l8(p) – (9) = 18 (Ep — ql < klp — ql < Ip- ql, 


lo cual es una contradicción. Esta contradicción debe provenir de la única suposi- 
ción p Æ q. Por lo tanto, p = q y el punto fijo en [a, b] es único. ш 


Ejemplo 2 Muestre que g(x) = (x? — 1)/3 tiene un punto fijo único en el intervalo [—1, 1]. 


Solución Los valores máximo y mínimo de g(x) para x en [—1, 1] deben ocurrir ya sea 
cuando x es un extremo del intervalo o cuando la derivada es 0. Puesto que g'(x) = 2х/3, 
la función g es continua y g'(x) existe en [—1, 1]. Los valores máximo y mínimo de g(x) se 
presentan en x 1,x=00x= 1.Рего g(—1) = 0, g(1) = 0 y 2(0) = —1/3, por lo que un 


máximo absoluto para g(x) en [-1, 1] se presenta en x = —1 y x = 1 y un mínimo absoluto 
enx = 0. 
Además, 
; 2х 2 
le (х) = ЕЯ < 3 para todas las x € (—1, 1). 


De este modo g satisface todas las hipótesis del teorema 2.3 y tiene un punto fijo único en 
[=1,.1]. п 


Para la función en el ejemplo 2, el único punto fijo р en el intervalo [—1, 1] se puede 
determinar de manera algebraica. Si 


р = 8(р) = , entonces р2 – 3р -– 1 = 0, 


lo cual, por la fórmula cuadrática, implica, como se muestra en la gráfica izquierda en la 
figura 2.4, que 


p= ¿0-VB) 


Observe que g también tiene un punto fijo único p = 1(3+У 13) para el intervalo [3,4]. 
Sin embargo, g(4) = 5 y g'(4) = 3 > 1, por lo que g no satisface la hipótesis del teorema 


2.3 en [3,4]. Esto demuestra que la hipótesis del teorema 2.3 es suficiente, pero no necesaria 
para garantizar la unicidad del punto fijo. (Consulte la gráfica de la derecha en la figura 2.4.) 
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Figura 2.4 


Ejemplo З Muestre que el teorema 2.3 no garantiza un punto fijo único de g(x) = 3 * en el intervalo 
[0, 1], aunque existe un punto fijo único en este intervalo. 


Solución g'(x) = —3 * In 3 < 0 еп [0, 1], la función g es estrictamente decreciente en 
[0, 1]. Por lo que 


< g(x)<1=g(0), para O<x<l. 


w] = 


801 = 


Por lo tanto, para x € [0, 1], tenemos g(x) € [0, 1]. La primera parte del teorema 2.3 garantiza 
que existe por lo menos un punto fijo en [0, 1]. 
Sin embargo, 


g'(0) = —In3 = —1.098612289, 
рог lo que |2'(х)| £ 1 en (0, 1), y el teorema 2.3 no se puede usar para determinar la uni- 


cidad. Pero g siempre decrece y es claro, a partir de la figura 2.5, que el punto fijo debe ser 
único. ш 


Figura 2.5 


Figura 2.6 
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Iteración de punto fijo 


No podemos determinar explícitamente el punto fijo en el ejemplo 3 porque no tenemos 
otra forma de resolver la ecuación р = g(p) = 3”. Sin embargo, podemos determinar las 
aproximaciones para este punto fijo con cualquier grado específico de precisión. Ahora con- 
sideraremos la forma de hacerlo. 

Para aproximar el punto fijo de una función g, elegimos una aproximación inicial po y 
generamos la sucesión {Pn} al permitir ph = 8(Pn-1), para cada п > 1. Si la sucesión 
converge a p y g es continua, entonces 


p= lím р, = lím gp) = g ( lím рал) =800), 
n>00 n>00 n—>00 


y se obtiene una solución para x = g(x). Esta técnica recibe el nombre de punto fijo o itera- 
ción funcional. El procedimiento se ilustra en la figura 2.6 y se detalla en el algoritmo 2.2. 


(P2; P3) 


(Pi; P2) 


Ї (рә, P2) (рә. рэ) 


(Pi; Ppi) 


(ро, P1) 


(Po Pi) (Pi; Pi) 


Pı P3 P2 Po 


a) 


ќегасібп de punto fijo 
Encontrar una solución de р = g(p) dada una aproximación inicial ре: 


ENTRADA aproximación inicial ро; tolerancia TOL; número máximo de iteraciones №0 . 
SALIDA aproximada р o mensaje de falla. 
Paso 1 Determine i = 1. 
Paso 2 Mientras i < Ny haga los pasos 3-6. 
Paso 3 Determine р = g(po). (Calcule pi.) 


Paso 4 $1 |р – pol < TOL entonces 
SALIDA (p); (El procedimiento fue exitoso.) 
PARE. 


Paso 5 Determine i = і + 1. 


Paso 6 Determine pọ = p. (Actualizar po.) 
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llustración 


Tabla 2.2 


Paso 7 SALIDA (‘El método falló después de Ny iteraciones, No =’, No); 
(El procedimiento no fue exitoso.) 
PARE. 


Lo siguiente ilustra algunas características de la iteración funcional. 


La ecuación х? +4x?—10=0 tiene una raíz única en [1, 2]. Existen muchas formas de 
cambiar la ecuación para la forma de punto fijo x = g(x) mediante una simple manipulación 
algebraica. Por ejemplo, para obtener la función g descrita en la parte c), podemos manipular 
la ecuación х? + 4x? — 10 = 0 como sigue: 


1 1 
4x? = 10 — х?, porloque х? = 200 = х), у x= +2010 ы), 


Para obtener una solución positiva, se selecciona g3(x). No es importante derivar las funcio- 
nes que se muestran aquí, pero debemos verificar que el punto fijo de cada una es en realidad 
una solución para la ecuación original, х? + 4x? — 10 = 0. 


= = x = x? — 4x? 10 а 
a) х= а(х) = хх — 4х +10 W sanws (= С ax) 
х 


1/2 
с) х= 23(х) = z0 =a)” d) x= 840) = (+ ) 
х 


) (х) x? + 4х2 – 10 
е) х= р5(х) =x — —— 
85 3x2 + 8x 


Con po = 1.5, la tabla 2.2 enumera los resultados de la iteración de punto fijo para las cinco 
selecciones de g. 


n (a) (b) (c) (d) (e) 
0 1.5 1.5 1.5 1.5 1.5 
1 —0.875 0.8165 1.286953768 1.348399725 1.373333333 
2 6.732 2.9969 1.402540804 1.367376372 1.365262015 
3 —469.7 (8.65)? 1.345458374 1.364957015 1.365230014 
4 1.03 x 108 1.375170253 1.365264748 1.365230013 
5 1.360094193 1.365225594 
6 1.367846968 1.365230576 
7 1.363887004 1.365229942 
8 1.365916734 1.365230022 
9 1.364878217 1.365230012 
10 1.3654 10062 1.365230014 
15 1.365223680 1.365230013 
20 1.365230236 
25 1.365230006 
30 1.365230013 


La raíz real es 1.365230013, como se observó en el ejemplo 1 de la sección 2.1. Al 
comparar los resultados con el algoritmo de bisección provisto en ese ejemplo, se puede 
observar que se han obtenido excelentes resultados para las opciones d) y e) (el método de 
bisección requiere 27 iteraciones para esta precisión). Es interesante observar que la opción 
a) era divergente y que la opción b) se volvió indefinida porque involucra la raíz cuadrada 
de un número negativo. ш 


Teorema 2.4 


Corolario 2.5 
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Aunque las diferentes funciones que hemos proporcionado son problemas de punto fijo 
para el mismo problema de encontrar la raíz, varían ampliamente como técnicas para aproxi- 
mar la solución a este último. Su objetivo es ilustrar lo que se debe contestar: 


e Pregunta: ¿Cómo podemos encontrar un problema de punto fijo que produce una sucesión 
en la que la fiabilidad y la rapidez convergen a la solución del problema de encontrar la 


raíz determinada? 


El siguiente teorema y su corolario nos proporcionan algunas claves respecto a los proce- 
dimientos que deberíamos seguir y, tal vez más importante, algunos que deberíamos rechazar. 


(Teorema de punto fijo) 


Sea g € Cla, b] tal que g(x) € la, b] para todas las x en [a, b]. Suponga, además, que existe 
g' en (a, b) y que existe una constante 0 < k < 1 con 


|\в'(х)| <k,  paratodas x € (a,b). 

Entonces, para cualquier número py en [a, b], la sucesión definida por 
Рп = 8(ра-1), n2l, 
converge al único punto fijo р en [a, Б]. 
Demostración El teorema 2.3 implica que existe un único punto p en [a, b] con g(p) = p. 
Ya que g mapea [a, b] en sí mismo, la sucesión {Pn}; ѕе define para todas las n > 0, y 
Pn € la, b] para todas las n. Al utilizar el hecho de que |g'(x)| < k y el teorema de valor 
medio 1.8, tenemos, para cada n, 
[рь = pl = |8 (0-1) — 8(р)| = |8 E) pra — PI < Краі — pl, 
donde ё„ € (a, b). Al aplicar esta desigualdad de manera inductiva obtenemos 
|р — pl < К|рп-1 = pl < 0|ра-2 = р <.-- SK"lpo— pl. (2.4) 

Ya que 0 < k < 1, tenemos йт, 30 k” = Оу 

lím |p, = pl < Иш k”|po — pl = 0. 

п оо n—>00 
Por lo tanto, { р, }2 converge a p. a 


Si g satisface las hipótesis del teorema 2.4, entonces las cotas del error relacionado con el uso 
de p, para aproximar p, están dadas por por 


Ip, = P| < К" máx{po — a, b — po) (2.5) 


n 


= К 


рп р| < |р: — pol, рага toda л > 1. (2.6) 


Demostración Puesto que р € la, b] la primera cota se sigue la desigualdad (2.4): 
Ip, = P| < К'|ро — p| < К" máx(po — a,b— po). 
Para n > 1, el procedimiento que se usa en la prueba del teorema 2.4 implica que 


|Pn+1 — Pa| = |8 (Pn) — 8(Pn-1)| < k| Pn — ра-11 < ++ < Кр — pol. 
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Ilustración 


Por lo tanto, para m > n > 1, 


[Pm = Pa| = |Pm = Pm-1 + Pm-1 —*** + раі — Pal 
< [рь = Pm-1| + |Pm-1 = Pm-2| +-+ + ро = Pal 
Spy = pol + "|р = pol +-+: + Кри — pol 
= k"|pi = pol (L +k +K? +- 4 1). 


Mediante el teorema 2.3, íM moo Pm = р, por lo que 


т—п—1 оо 
|р = Pal = Ит |р» = ра < lím K"lpy= pol у, K 1р pol X i. 
i=0 i=0 


Pero У)? k' es una serie geométrica con radio k y O < k < 1. Esta sucesión converge а 
1/(1 — k), lo que nos da la segunda cota: 


n 


|< 
© 1—К& 


|P — Pn [рі = pol. п 


Ambas desigualdades en el corolario relacionan la razón еп la que { р, }2 o converge a la 


cota k de la primera derivada. La razón de convergencia depende del factor k”. Mientras más 
pequeño sea el valor de k, más rápido convergerá. Sin embargo, la convergencia sería muy 
lenta si k está cercana a 1. 


Reconsideremos los diferentes esquemas de punto fijo descritos en la ilustración anterior en 
vista del teorema de punto fijo 2.4 y su corolario 2.5. 


a) Para (х) = x — x? — 4x? + 10, tenemos 21(1) = 6 y 8,02) = —12, por lo que g, 
по mapea [1, 2] en sí mismo. Además е'(х) = 1 — 3х2 — 8x, por lo que |1 ОО] > 1 
para todas las x en [1, 2]. A pesar de que el teorema 2.4 no garantiza que el método 
debe fallar para esta selección de g, no existe una razón para esperar convergencia. 


b) Con g2(x) = [(10/x) – 4х]!?”, podemos ver que g) no traza un тара [1,2] en 
[1,2], y la sucesión {Рп}л=о no está definida cuando Po = 1.5. Además, no existe un 
intervalo que contiene p ~ 1.365 tal que lg5(x)] < 1 puesto que |g5(p)| ~ 3.4. 
No existe una razón para esperar que este método convergerá. 


с) Para la función ез(х) = 3(10 — x*)!/? tenemos 


3 
gax) = 400 у <0 еп[1,2], 


por lo que g, es estrictamente decreciente en [1, 2]. Sin embargo |g4(2)| ~ 2.12, 
por lo que la condición |g3(x)] < k < 1 falla en [1,2]. Un análisis más cercano de 
la sucesión {pn}? o comenzando con ро = 1.5 muestra que es suficiente considerar 


el intervalo [1, 1.5] en lugar de [1, 2]. En este intervalo, sigue siendo verdad que 
83() < Оу оз es estrictamente decreciente, pero, además, 


1 < 1.28 Y g3(1.5) < g3(x) < 830) = 1.5, 


para todas las x € [1, 1.5]. Esto muestra que g, mapea el intervalo [1, 1.5] en sí 
mismo. También es verdad que |g4(x)| < |е5(1.5)| ~ 0.66 en este intervalo, por 
lo que el teorema 2.4 confirma la convergencia que ya conocemos. 
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d) Para g4(x) = (10/(4 + х))!, tenemos 


< 0.15, рага todas las x € [1,2]. 


18400) = 


—5 5 
тат = 7100552 


La magnitud de la cota de g'4(x) es mucho menor que la magnitud de la cota (encon- 
trada en с)) g'(x), lo cual explica la convergencia más rápida usando ga. 


e) La sucesión definida por 


x3+4x?-10 


pums- 3x? + 8x 


converge mucho más rápido que nuestras otras elecciones. En las siguientes seccio- 
nes, observaremos de dónde proviene esta elección y porqué es tan efectiva. п 


A partir de lo que hemos observado, la 

e Pregunta: ¿Cómo podemos encontrar un problema de punto fijo que produce una sucesión 
que converge de manera confiable y rápida en una solución para un problema dado de 
encontrar la raíz? 

podríamos tener la 

e Respuesta: manipular el problema de encontrar la raíz en un problema de punto fijo que 
satisfaga las condiciones del teorema de punto fijo 2.4 y hacer la derivada tan pequeña 
como sea posible cerca del punto fijo. 


En las siguientes secciones examinaremos esto con mayor detalle. 


La sección Conjunto de ejercicios 2.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WN F 2.3 Método de Newton y sus extensiones 


Isaac Newton (1641-1727) 

fue uno de los científicos más 
brillantes de todos los tiempos. 
El final del siglo хуп fue un 
periodo vibrante para la ciencia 
y las matemáticas, y el trabajo 
de Newton tocó casi todos los 
aspectos de esta última ciencia. 
Se presentó su método de 
resolución para encontrar la raíz 


de la ecuación y? — 2y — 5 = 0. 


A pesar de que demostró el 
método sólo para polinomios, 
es claro que conocía sus 
aplicaciones más amplias. 


El método de Newton (o de Newton-Raphson) es uno de los métodos numéricos más pode- 
rosos y reconocidos para resolver un problema de encontrar la raíz. Existen muchas formas 
de presentar el método de Newton. 


Método de Newton 


Si sólo queremos un algoritmo, podemos considerar la técnica de manera gráfica, como 
a menudo se hace en cálculo. Otra posibilidad es derivar el método de Newton como una 
técnica para obtener convergencia más rápida de lo que ofrecen otros tipos de iteración 
funcional, como hacemos en la sección 2.4. Una tercera forma para presentar el método de 
Newton, que se analiza a continuación, está basada en los polinomios de Taylor. Ahí obser- 
varemos que esta forma particular no sólo produce el método, sino también una cota para el 
error de aproximación. 

Suponga que f e C?[a, b]. Si p, € la, b] es una aproximación para p, de tal forma que 
F'(po) + Оу |p — pol es “pequeño”. Considere que el primer polinomio de Taylor para f(x) 
expandido alrededor de ро y evaluado en x = p: 


(р = ро)? 


Fp) = / (ро) + (р — ро) (ро) + > PE, 
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Joseph Raphson (1648-1715) 
proporcionó una descripción 
del método atribuido a Isaac 
Newton en 1690 y reconoció 

a Newton como la fuente 

del descubrimiento. Ni 

Newton ni Raphson utilizaron 
explícitamente la derivada en 
su descripción ya que ambos 
sólo consideraron polinomios. 
Otros matemáticos, en especial 
James Gregory (1636-1675), 
estaban conscientes del proceso 
subyacente en esa época o antes. 


Figura 2.7 


donde é(p) se encuentra entre p y ро. Puesto que /(р) = 0, esta ecuación nos da 


(р = ро)? 


0 = f(po) + (р — ро) ' (ро) + 2 0 


El método de Newton se deriva al suponer que сото |p— ро| es pequeño, el término 
relacionado con (p — po)? es mucho más pequeño, entonces 


0= f(po)+ (p = ро)/'(ро). 


Al resolver para p obtenemos 


_ Хо) _ 3 
Гро). 


Esto constituye la base рага el método de Newton, que empieza соп una aproximación 
inicial ро y genera la sucesión {р}? , mediante 


P ™ ро 


F(Pn-1) 
F (Pr) І 


La figura 2.7 ilustra cómo se obtienen las aproximaciones usando tangentes sucesivas. 
(Además observe el ejercicio 31.) Al empezar con la aproximación inicial po, la aproxima- 
ción pı es la intersección con el eje x de la recta tangente a la gráfica de f en (ро, f(po)). La 
aproximación р» es la intersección con el eje х de la recta tangente a la gráfica f en (ру, f(p1)) 
y así sucesivamente. El algoritmo 2.3 implementa este procedimiento. 


Ра = Pn- — paran > 1. (2.7) 


Pendiente f'(p,) 


(р\.//(р)) 


Pendiente f'(pp) 


„> 
X 


(Po; f(Po)) 


Método de Newton 
Para encontrar una solución a f(x) = O dada una aproximación inicial po: 


ENTRADA aproximación inicial ро tolerancia TOL; número máximo de iteraciones No 
SALIDA solución aproximada p o mensaje de falla. 


Paso 1 Determine i = 1. 
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Paso 2 Mientras і < No haga los pasos 3-6. 
Paso 3 Determine p = po — f(po)/f'(po). (Calcule р) 


Paso 4 Silp— pol < TOL entonces 
SALIDA (p); (El procedimiento fue exitoso.) 
PARE. 


Paso 5 Реѓегтіпеі = і + 1. 
Paso 6 Determine ро = р. (Actualizce ро.) 


Paso 7 SALIDA (“ЕІ método falló después de Ny iteraciones, № =”, No); 
(El procedimiento no fue exitoso.) 
PARE. н 


Las desigualdades de la técnica de parada determinadas соп el método de bisección son 
aplicables al método de Newton. Es decir, seleccione una tolerancia e > 0 y construya pj, 
..., py hasta que 


|PN = Pral < €, (2.8) 
[Pr Раа эсш 0.9) 
py! 
о 
| (рм)| < €. (2.10) 


Una forma de la desigualdad (2.8) se usa en el paso 4 del algoritmo 2.3. Observe que nin- 
guna de las desigualdades (2.8), (2.9) o (2.10) dan información precisa sobre el error real 
[Іру — pl. (Consulte los ejercicios 19 y 20 en la sección 2.1). 

El método de Newton es una técnica de iteración funcional con р, = g(pn-1), para la 
que 


F(Pn-1) 
Fo” 


De hecho, esta es la técnica de iteración funcional que se usó para proporcionar la conver- 
gencia rápida que vimos en la columna e) de la tabla 2.2 en la sección 2.2. 

A partir de la ecuación (2.7) es claro que el método de Newton no se puede continuar si 
F'(Pn-1) = О para alguna n. De hecho, observaremos que el método es más eficaz cuando f’ 
está acotada lejos de cero y cerca de p. 


8(Pn-1) = Pn-1 — para п > 1. (2.11) 


Ejemplo 1 Considere la función f(x) = cos x — x = 0. Aproxime una raíz de f usando а) el método de 
punto fijo y b) el método de Newton. 


Solución a) Una solución para este problema de encontrar la raíz también es una solución 
para el problema de punto fijo x = cos x, y la gráfica en la figura 2.8 implica que un solo 
punto fijo p se encuentra en [0, 7/2]. 
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Figura 2.8 


Observe que la variable en la 
función trigonométrica está 
medida en radianes, no grados. 
Éste siempre será el caso a 
menos que se especifique lo 
contrario. 


Tabla 2.3 
n Pn 
i o La tabla 2.3 muestra los resultados de la iteración de punto fijo con p, = 77/4. Lo mejor 
2 07 602445972 que podríamos concluir a partir de estos resultados es que p ~ 0.74. 
3 072 46674808 b) Para aplicar el método de Newton a este problema, necesitamos f'(x) = —senx — 1. 
4 0.7487198858 Al iniciar de nuevo en ро = 7/4, tenemos 
5 0.7325608446 р 
0 

6 0.7434642113 Pi = Po- + 
7 0.7361282565 F'(po) 

om со5(л/4) – л/4 

4 —$зеп(л/4)—1 

л y2/2-71/4 

4 —02/2—1 

= 0.7395361337 

созд) = Pi 

Р еар) l 

= 0.739085 1781 
Tabla 2.4 Nosotros generamos continuamente la sucesión mediante 
Método de Newt 

С рь = р _ /(рл-1) =р COS Pn-1 = Pn-1 

п Pn n n—1 FO n—1 — Sen рь — 1 . 
0 0.7853981635 
1 0.7395361337 Esto nos da las aproximaciones en la tabla 2.4. Se obtiene una excelente aproximación con 
2 0.7390851781 п = 3. Debido a la cercanía де p3 y pa, podríamos esperar razonablemente que este resultado 
3 0.739085 1332 sea preciso con los decimales enumerados. п 
4 0.739085 1332 


Convergencia con el método de Newton 


El ejemplo 1 muestra que el método de Newton puede dar aproximaciones en extremo pre- 
cisas con muy pocas iteraciones. Para ese ejemplo, sólo se necesitó una iteración del método 
de Newton para dar una precisión mayor que las siete iteraciones del método de punto fijo. 
Ahora es momento de examinar el método de Newton para descubrir porqué es tan eficaz. 

La derivación del método de Newton por medio de la serie de Taylor al inicio de la sec- 
ción señala la importancia de una aproximación inicial precisa. La suposición crucial es que 
el término relacionado con (p — po)? es, en comparación con | р — Pol, tan pequeño que se 
puede eliminar. Claramente esto será falso a menos que py sea una buena aproximación para 
р. Si ро no está suficientemente cerca de la raíz real, existen pocas razones para sospechar 
que el método de Newton convergerá en la raíz. Sin embargo, en algunos casos, incluso las 
malas aproximaciones iniciales producirán convergencia. (Los ejercicios 15 y 16 ilustran 
algunas de las posibilidades.) 


Teorema 2.6 
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El siguiente teorema de convergencia para el método de Newton ilustra la importancia 
teórica de la selección de po. 


Sea f e С?[а, b]. Si p e (a, b) es tal que f (р) = 0 y f'(p) 5% 0, entonces existe una ô > 0 
tal que el método de Newton genera una sucesión (Pp), que converge a p para cualquier 
aproximación inicial ро € [p — ô, p + ô]. 


Demostración La prueba se basa en el análisis del método de Newton como un esquema de 
iteración funcional р, = g(pn-1) para п > 1, con 


Fx) 
FO 


О) =x — 


Sea k un número entre (О, 1). Primero encontramos un intervalo [p — ô, р + б] que g mapea 
en sí mismo y para el cual |g'(x)| < k para todas las x € (р — ô, p + ô). 

Ya que f’ es continua y /'(р) -# 0, la parte a) del ejercicio 30 en la sección 1.1 implica 
que existe una ô; > 0, tal que f'(x) 40 para x € [р — ё, p + дү] С [а, b]. Por lo tanto, 
g está definida y es continua en [p — 91, р + 61]. Además, 


FOLO- РО)" ә) FOO) 


(ху = 1 = | 
80) POr POP 


para x € [р — бу, р + ё] y, puesto que f e Ca, b], tenemos g e C'[p — ôi, p + 61]. 
Por hipótesis, (р) = 0 por lo que 


Р(р)Ј"(р) ij 


TOTS 


Puesto que g’ es continua y 0 < k < 1, la parte b) del ejercicio 30 en la sección 1.1 implica 
que existe ô, con 0 < ô < бу, para el cual 


|8'(х)| <k, para todas las x € [p — 8, p + ô]. 


Falta probar que g mapea [p — ô, p + 8] en [p — 8, p + ô]. Si x € [p — ô, p + 
ô], el teorema de valor medio implica que para algún número ё entre x y p,lg(x)—g(p)| 
= |@'(&)||х — pl. Por lo tanto, 


lœ) — pl = 18(х) — g(p)l = lg Elx — pl < klx — p| < |х — pl. 


Puesto que x € [p — ô, p + ô], se sigue que |x — p| < $ y que |g(x) — p| < ô. Por lo tanto, 
g mapea [p — ô, p + б] en [р — ô, p + б]. 

Ahora, se satisfacen todas las hipótesis del teorema de punto fijo 2.4, por lo que la su- 
cesión {р„}2 |, definida por 


FlPn—1) 
F'n) 


converge a p para cualquier po € [p — ô, p + ô]. E 


Pn = 8(Pn-1) = Pn-1 — para n > 1, 


El teorema 2.6 establece que, de acuerdo con suposiciones razonables, el método de 
Newton converge, siempre que se seleccione una aproximación inicial suficientemente exac- 
ta. También implica que la constante k que acota la derivada de g y, por consiguiente, indica 
que la velocidad de convergencia del método disminuye a 0, conforme el procedimiento 
continúa. Este resultado es importante para la teoría del método de Newton, pero casi nunca 
se aplica en la práctica porque no nos dice cómo determinar ô. 

En una aplicación práctica, se selecciona una aproximación inicial y se generan aproxi- 
maciones sucesivas con el método de Newton. Ya sea que éstos converjan rápidamente a la 
raíz o será claro que la convergencia es poco probable. 


54 CAPÍTULO 2 = Soluciones de las ecuaciones en una variable 


La palabra secante se deriva de 
la palabra en latín secan, que 
significa “cortar”. El método de 
la secante usa una línea secante, 
que une dos puntos que cortan la 
curva, para aproximar una raíz. 


Figura 2.9 


El método de la secante 


El método de Newton es una técnica en extremo poderosa, pero tiene una debilidad impor- 
tante: la necesidad de conocer el valor de la derivada de fen cada aproximación. Con fre- 
cuencia, f'(x) es mucho más difícil y necesita más operaciones aritméticas para calcular f(x). 

Para evitar el problema de la evaluación de la derivada en el método de Newton, presen- 
tamos una ligera variación. Por definición, 


Poias m ЛО) = fna) 


x> Pp-1 х = Pn-1 


Si paz está cerca de р, 1, entonces 


F(Ppn-2) = F(Pn-1) ХИ Р(рп-1) са F(Pn-2) 
Pn-2 = Pn-1 Pa=1 Pr? ` 


F paa) ~ 


Usando esta aproximación para f'(p,_1) en la fórmula de Newton obtenemos 


f(Pn-1)(Pn-1 B Рп—2) 


(2.12) 
F(Pn-1) F(Pn-2) 


Pn = Pn-1 — 


Esta técnica recibe el nombre de método de la secante y se presenta en el algoritmo 2.4 
(consulte la figura 2.9). Empezando con dos aproximaciones iniciales ро y pı, la aproxima- 
ción ро es la intersección еп x de la recta que une los puntos (ро, f(po)) y (pı, f(p1)). La apro- 
ximación рз es la intersección en x de la recta que une los puntos (p,,.f(p,)) y (ро, f(p2)) y así 
sucesivamente. Observe que sólo se necesita una evaluación de la función por cada paso para 
el método de la secante después de haber determinado р». En contraste, cada paso del método 
de Newton requiere una evaluación tanto de la función como de su derivada. 


Método de la secante 
Para encontrar una solución para f(x) = 0 dadas las aproximaciones iniciales p, y p: 


ENTRADA aproximaciones iniciales po, pı tolerancia TOL; número máximo 
de iteraciones No. 


SALIDA solución aproximada р o mensaje de falla. 


Paso 1 Determine i = 2; 
qo = f(po); 
qı = f (pi). 


Ejemplo 2 


Tabla 2.5 

Secante 
n Pn 
0 0.5 
1 0.7853981635 
2 0.7363841388 
3 0.7390581392 
4 0.7390851493 
5 0.7390851332 

Newton 

Pn 

0 0.7853981635 
1 0.7395361337 
2 0.7390851781 
3 0.7390851332 
4 0.7390851332 
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Paso 2 Mientras i < No haga los pasos 3-6. 
Paso 3 Determine p = ру — qı (pı — po)/(qı — до). (Calcule р 


Paso 4 $1 |р – pı| < TOL entonces 
SALIDA (p), (El procedimiento fue exitoso.) 
PARE. 


Paso 5 Determine i = і +1. 


Paso 6 Determine po = pi; (Actualice ро, 40, pi, qı) 


do = q1; 
Pı = P; 
qı = f (p). 


Paso 7 SALIDA (“El método falló después de Ny iteraciones, No =”, No); 
(El procedimiento no fue exitoso.) 
PARE. ш 


El siguiente ejemplo incluye el problema que se consideró en el ejemplo 1, donde utili- 
zamos el método de Newton con py = 1/4. 


Use el método de la secante para encontrar una solución para x = cos x y compare las aproxi- 
maciones con las determinadas en el ejemplo 1, el cual aplica el método de Newton. 


Solución En el ejemplo 1, comparamos la iteración del punto fijo y el método de New- 
ton con la aproximación inicial pp = л/4. Para el método de la secante, necesitamos dos 
aproximaciones iniciales. 


Suponga que usamos ро = 0.5 y pı = 1/4: 


Ф = Po) (cos pi — р) 

(cos pı — pı) — (cos p2 — p2) 

л (л/4 — 0.5)(соѕ(7/4) — л/4) 
74 (сов(л/4) – л/4) — (соѕ0.5 — 0.5) 
= 0.7363841388. 


рә = Pi 


Las aproximaciones sucesivas se generan con Іа fórmula 


(Pn-1 == Pn-2) (cos Pn-1 > Pn-1) 
(COS Pn-1 — Pn-1) — (COS Pn-2 — Pn-2) 


Pn = Pn-1 7 , paran > 2. 


Esto proporciona los resultados en la tabla 2.5. Observamos que a pesar de que la fórmula 
рага p, parece indicar un cálculo repetido, una vez que se calcula (ро) y f(p1), no se calculan 
de nuevo. а 


Al comparar los resultados еп la tabla 2.5 a partir del método de la secante y el método 
de Newton, observamos que la aproximación р» del método de la secante es precisa hasta la 
décima cifra decimal, mientras que con el método de Newton se obtuvo esta precisión por 
p3. Para este ejemplo, la convergencia del método de la secante es mucho más rápida que la 
iteración funcional, pero ligeramente más lenta que el método de Newton. Éste es, en gene- 
ral, el caso. (Consulte el ejercicio 14 de la sección 2.4.) 

El método de Newton o el método de la secante con frecuencia se usan para refinar una 
respuesta obtenida con otra técnica, como el método de bisección, ya que estos métodos re- 
quieren una primera aproximación adecuada pero, en general, proveen convergencia rápida. 
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El término Regula Falsi, 
literalmente “regla falsa” o 
“posición falsa” se refiere a 
una técnica en la que se usan 
resultados que se sabe son falsos, 
pero de algún modo específico, 
para obtener convergencia 

a un resultado verdadero. 

Los problemas de posición 
falsa se pueden encontrar en 

el papiro Rhind, que data de 
aproximadamente 1650 a.C. 


Figura 2.10 
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El método de posición falsa 


Cada par sucesivo de aproximaciones en el método de bisección agrupa una raíz p de la ecua- 
ción; es decir, para cada entero positivo n, se encuentra una raíz entre a, y b,. Esto implica 
que, para cada n, las iteraciones del método de bisección satisfacen 


1 
рь = pl < 218 = |, 


Іо cual provee una cota del error fácilmente calculable para las aproximaciones. 

La agrupación de raíces no está garantizada para el método de Newton ni para el 
método de la secante. En el ejemplo 1, el método de Newton se aplicó a f(x) = cos x — ху 
se encontró que la raíz aproximada es 0.7390851332. La tabla 25 muestra que esta raíz no 
se agrupa mediante po y pı о pı y p2. Las aproximaciones del método de la secante para este 
problema también se determinan en la tabla 2.5. En este caso, las aproximaciones iniciales 
Po y pı agrupan la raíz, pero el par de aproximaciones рз y pafallan al hacerlo. 

El método de posición falsa (también llamado Regula Falsi) genera aproximaciones 
de la misma manera que el método de la secante, pero incluye una prueba para garantizar que 
la raíz siempre se agrupa entre iteraciones sucesivas. А pesar de que no es un método que por 
lo general recomendamos, ilustra cómo se puede integrar la agrupación. 

En primer lugar, seleccionamos las aproximaciones iniciales py y pı con (ро) · рт) < 0. 
La aproximación р» se selecciona de la misma forma que en el método de la secante como la 
intersección en x de la recta que une (po, f(po)) y (pı, f(p1)). Para decidir cuál línea secante 
se usa para calcular рз, considere f(p2) · f(p1) o, más correctamente, sgn f(p>) - sgn (рі). 


• Si sgn f(p>) * sen f(p1) < 0, entonces p, y p, agrupan una raíz. Seleccione p, como la in- 
tersección en х de la recta que une (ру, f(p1)) y (р„ F(p,))- 


e Si no, seleccionamos рз como la intersección en х de la recta que une (ро, f(po)) y (p2, 
F(P2)) y, a continuación intercambia los índices en po y р. 


De manera similar, una vez que se encuentra p,, el signo de f(p3) · (ро) determina si usamos 
P2 Y p3 0 рз y pı para calcular p,. En el último caso, se vuelve a etiquetar p y pı. Reetiquetar 
garantiza que la raíz se agrupa entre iteraciones sucesivas. El proceso, como se describe en 
el algoritmo 2.5 y la figura 2.10 muestra cómo las iteraciones pueden diferir de las del mé- 
todo de la secante. En esta ilustración, las primeras tres aproximaciones son iguales, pero la 
cuarta difiere. 


Método de posición falsa 


Método de la secante 


у= 0) у= р) 
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Posición falsa 


Para encontrar una solución рага f(x) = O dada la función f continua en el intervalo [po, pı] 
donde fípo) y f(p1) tienen signos opuestos: 


ENTRADA 


aproximaciones iniciales ро, pı tolerancia ТОГ; número máximo de 
iteraciones No. 


SALIDA solución aproximada р o mensaje de falla. 
Paso 1 Determine i = 2; 


40 = f (po); 
qı = f (pı). 


Paso 2 Mientras i < Ny haga los pasos 3—7. 
Paso З Determine p = pı — qı (pı — po)/(qı — qo). (Calcule р. 


Paso 4 Si |р — pı| < TOL entonces 


SALIDA (p), (El procedimiento fue exitoso.) 
PARE. 
Paso 5 Determine i =i + 1; 
q = f (p). 
Paso 6 Siq -qı < 0 entonces determine po = pı; 


qo = 41. 
Paso 7 Determine pı = р; 
41 = 4. 
Paso 8 SALIDA (El método falló después de Ny iteraciones, No =”, No); 


(El procedimiento no fue exitoso.) 
PARE. ш 


Ejemplo 3 Use el método de posición falsa para encontrar una solución a x = cos x y compare las apro- 
ximaciones con aquellas determinadas en el ejemplo 1, que aplican la iteración del punto fijo 
y el método de Newton, y con aquellas encontradas en el ejemplo 2, que aplica el método 
de la secante. 
Solución Para efectuar una comparación razonable usaremos las mismas aproximaciones 
iniciales que en el método de la secante; es decir py = 0.5 y pı = 7/4. La tabla 2.6 muestra los 
resultados del método de posición falsa aplicado a f(x) = cos x — x junto con los obtenidos 
mediante los métodos de la secante y de Newton. Observe que las aproximaciones de posición 
falsa y de la secante concuerdan a través de p, y que el método de posición falsa requiere una 
iteración adicional para obtener la misma precisión que el método de la secante. ш 

Tabla 2.6 Posición falsa Secante Newton 

n Pn Pn Pn 
0 0.5 0.5 0.7853981635 
1 0.7853981635 0.7853981635 0.7395361337 
2 0.7363841388 0.7363841388 0.7390851781 
З 0.739058 1392 0.739058 1392 0.7390851332 
4 0.7390848638 0.739085 1493 0.7390851332 
5 0.739085 1305 0.739085 1332 
6 0.7390851332 
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Definición 2.7 


Ilustración 


Comúnmente, la seguridad adicional del método de posición falsa requiere más cálculos 
que el método de la secante, de la misma forma en que la simplificación proporcionada por el 
método de la secante sobre el método de Newton se realiza a expensas de iteraciones adicio- 
nales. Más ejemplos de las características positivas y negativas de estos métodos se pueden 
observar al trabajar en los ejercicios 13 y 14. 


La sección Conjunto de ejercicios 2.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Análisis de error para métodos iterativos 


En esta sección investigamos el orden de convergencia de esquemas de iteración funcional 
y, con el propósito de obtener convergencia rápida, redescubrimos el método de Newton. 
También consideramos formas para acelerar la convergencia del método de Newton en cir- 
cunstancias especiales. Primero, sin embargo, necesitamos un nuevo procedimiento para 
medir qué tan rápido converge una sucesión. 


Orden de convergencia 


Suponga que {р»}есу es una sucesión que converge a p, con р, % p para todas las n. Si 
existen constantes positivas A y œ con 


iin [рамі = pl — 
n>% |р„—р|® 


Entonces {рл }?°-у converge a р de orden e, con constante de error asintótica A. ш 


Se dice que una técnica iterativa de la forma pn = @(рл—1) es de orden о si la sucesión 
{р„\2 0 converge а la solución р = g(p) de orden о. 

En general, una sucesión con un alto orden converge más rápidamente que una sucesión 
con un orden más bajo. La constante asintótica afecta la velocidad de convergencia pero no 
el grado del orden. Se presta atención especial a dos casos: 


i) Sia = 1 (ул < 1), la sucesión es linealmente convergente. 


ii) Sia = 2, la sucesión es cuadráticamente convergente. 


La siguiente ilustración compara una linealmente convergente con una que es cuadrá- 
ticamente convergente. Y se muestra por qué tratamos de encontrar métodos que producen 
sucesiones convergentes de orden superior. 


Suponga que { р, }2 es linealmente convergente en 0 con 


Y que [Pn);=p es cuadráticamente convergente a 0 con la misma constante de error asintó- 
tico, 


Por simplicidad, asumimos que para cada n, tenemos 


|Рп+1! E |Ёп+1| 
|Pnl |Р 
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Para el esquema linealmente convergente, esto significa que 
ра = 01 = [Pal %0.5|pn-11 ~ (0.5) pr] ~ +++ ~ (0.5)"| pol, 
mientras el procedimiento cuadráticamente convergente es 
Bn = 01 = 11 %0.5/5, 117 (0.5)10.515, 21" = (0.57 197-21 
(0.57 10.5) Pr = (0.511 Hp 31% 


(057 pol”. 


La tabla 2.7 ilustra la velocidad relativa de convergencia de las sucesiones en О si 


lpo] = [Pol = 1. 
Tabla 2.7 Sucesión de convergencia Sucesión de convergencia 
lineal {р )2 o cuadrática {Øn}; o 

n (0.5)" (0.577! 

1 5.0000 x 107! 5.0000 x 107! 

2 2.5000 x 107! 1.2500 x 107! 

3 1.2500 x 107! 7.8125 x 107? 
4 6.2500 x 107? 3.0518 x 1075 

5 3.1250 x 107? 4.6566 x 1071 
6 1.5625 x 107? 1.0842 x 1071? 
7 7.8125 x 107° 5.8775 x 107% 


La sucesión cuadráticamente convergente se encuentra dentro de 107% de 0 mediante el 
séptimo término. Se necesitan por lo menos 126 términos para garantizar esta precisión para 
la sucesión linealmente convergente. ш 


Se espera que las sucesiones cuadráticamente convergentes converjan mucho más rá- 
pido que las que sólo convergen linealmente, pero el siguiente resultado implica que una 
técnica de punto fijo arbitraria que genera secuencias convergentes sólo lo hace linealmente. 


Teorema 2.8 Sea в € [a, b] tal que g(x) € [a, b] para todas las x € [a, b]. Suponga además que g’ es con- 
tinua en (a, b) y que existe una constante positiva k < 1 con 


[2'(х)| <k, para toda x є (a, b). 
Si g'(p) 5 0, entonces para cualquier número ро Æ p en [a, b], la sucesión 


Pn = 8(рһ-1). paran > 1, 


Converge sólo linealmente para el único punto fijo p en [a, b]. 


Demostración Sabemos que, a partir del teorema de punto fijo en la sección 2.2, la sucesión 
converge а p. Puesto que existe g’ en (а, b), podemos aplicar el teorema del valor medio para 
g para demostrar que para cualquier п, 


Рп+1 = Р = 8(Pn)— 8(р) = 8 (En MPn — р), 


donde é, está entre р, у p. Ya que {р„}?° ү converge a p, también tenemos que {ё„}?е у 
converge a p. Puesto que gy es continua en (a, b), tenemos 


mm 8 En) = & (р). 
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Teorema 2.9 


Por lo tanto 


liin Pn+1 — P = ím 2 (E) =2g(p) y lím |Pan+1 = Pl = |g' 
тос pamp “жн n>% |р„—р| 


De este modo, si g'(p) # 0, la iteración de punto fijo muestra convergencia lineal con error 
asintótico constante |g'(p)!. ш 


El teorema 2.8 implica que la convergencia de orden superior para los métodos de punto 
fijo de la forma g(p) = р sólo se puede presentar cuando g'(p) = 0. El siguiente resultado 
describe condiciones adicionales que garantizan la convergencia cuadrática que buscamos. 


Sea p una solución de la ecuación x = g(x). Suponga que g'(p) = 0 y que g” es continua con 
lg" (x)| < M en un intervalo abierto I que contiene a p. Entonces existe ô > 0 tal que para po 
€ [p — ô, p + ô], la sucesión definida por р„ = g(p,-1), cuando п > 1, converge, por lo menos 
cuadráticamente a p. Además, con valores suficientemente grandes de n, 


M 2 
[рам = pl < Ds = рі. 


Demostración Seleccione k en (0, 1) y ô > 0 tal que en el intervalo [р — ô, p + ô], conteni- 
do en /, tenemos |g'(x)] < k y g” continua. Puesto que |g'(x)] < k < 1, el argumento 
utilizado en la prueba del teorema 2.6 en la sección 2.3 muestra que los términos de la suce- 
sión {р, }20 están contenidos en [р — 0, p + ô]. Al expandir g(x) en un polinomio lineal de 
Taylor, para x € [р — ô, p + ё] obtenemos 


ae ра о р)?, 


donde é se encuentra entre х y р. Las hipótesis g(p) = ру g'(p) = 0 implican que 


8(х) = р+ a — př. 


En especial, cuando х = р,, 


8” (Én) 


_ 2 
> (рь = р). 


Рһ+1 = 8(Pn) = р F 


con é, entre p, y p. Por lo tanto, 


g” En) 
Pn+1 p= 2 (Pa py. 


Puesto que |g'(x)] < k < 1 en [p — ô, p + ô] y g mapea [p — ô, p + ô] en sí mismo, por el 
teorema de punto fijo se sigue que { р, }2 у converge а p. Pero como é, se encuentra entre р 
y Pn para cada n, entonces {én}? y también convergen ар y 


[Pa = Pl _ |8 (р)| 
m z~ * 
n>00 |р„—р| 2 


Este resultado implica que la sucesión { р» }?° es cuadráticamente convergente si g"(p) 4 0 
y de convergencia de orden superior si 2"(р) = 0. 

Puesto que g” es continua y está estrictamente acotada por M en el intervalo [p — ô, p + ô], 
esto también implica que, para los valores suficientemente grandes de n, 


M 2 
3 lpr pl”. н 


рат = pl < 2 


Definición 2.10 


Para polinomios, p es un cero de 
multiplicidad m de f, si 

f(x) = (x — р)" (х), donde 
4(р) #0. 


2.4 Análisis de error para métodos iterativos 61 


Los teoremas 2.8 y 2.9 nos indican que nuestra búsqueda de métodos de punto fijo que 
convergen cuadráticamente deberían señalar hacia funciones cuyas derivadas son cero en el 
punto fijo. Es decir, 


e Para un método de punto fijo que converge cuadráticamente, necesitamos tener tanto g(p) 
= p como g'(p) = 0. 


La forma más fácil de construir un problema de punto fijo relacionado con el problema 
de encontrar la raíz f(x) = 0 es sumar o restar un múltiplo de f(x) a partir de x. Considere la 
sucesión 


Pn=8(Pn-1), рагап > 1, 
para g en la forma de 


8(х) =x — ф(х) a), 


donde ф es una función diferenciable que se seleccionará más adelante. 
Para que el procedimiento iterativo derivado de g sea convergente cuadráticamente, 
necesitamos tener g'(p) = 0 cuando f(p) = 0. Ya que 


80) =1- ф(х) Р(х) – /'(х)ф(х) 
у Ар) = 0, tenemos 
8 0р) = 1— ф'(р) (р) — /'(р)ф(р) = 1— Ф'(р)-0— Ј'(р)ф(р) = 1 — /'(р)ф(р), 
y 8 (p) = 0 si y sólo si ф(р) = Uf (р). 


Si hacemos ф(х) = 1/f'(x) entonces garantizamos que el procedimiento converge cua- 
dráticamente 


F(Pn-1) 
F(Pn=1) І 


Esto, por supuesto, es simplemente el método de Newton. Por lo tanto, 


Pn = 8(Pn-1) = Pn-1— 


• 51/(р) = Оу f'(p) #0, entonces para los valores suficientemente cercanos a p, el méto- 
do de Newton convergerá por lo menos cuadráticamente. 


Raíces múltiples 


En el análisis anterior se efectuó una restricción en la que /'(р) 5 0, donde р es la solución 
de f(x) = 0. En especial, el método de Newton y el método de la secante, en general, dan 
problemas si f'(p) = 0 cuando f(p) = 0. Para examinar estas dificultades más detalladamen- 
te, damos la siguiente definición. 


Una solución p de f(x) = 0 es un cero de multiplicidad m de f si рага х 4 p, podemos 
escribir f(x) = (x — p)”g(x), donde lim, p q (x) 40. ш 


En esencia, q(x) representa la porción de f(x) que no contribuye con el cero de f. El 
siguiente resultado proporciona los medios para identificar fácilmente los ceros simples de 
una función, aquellos que tienen multiplicidad uno. 
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Teorema 2.11 


Teorema 2.12 


Ejemplo 1 


= Soluciones de las ecuaciones en una variable 


La función f e С![а, b] tiene un cero simple en р en (а, b) si y sólo si f(p) = 0, pero f'(p) 4 0. 


Demostración Si f tiene un cero simple en p, entonces /(р) = О y f(x) = (x — p)q(), 
donde іт, p q(x) # 0. Ya que f € Са, b], 


/'(р) = Tm Fœ = іт [4 (0) + (х = р)4' (x)] = Ит q) % 0. 


Рог otra parte, si f (p) = 0 pero /'(р) 5 0, represente a f сото polinomio de Taylor de 
grado cero alrededor de p. Entonces 


Ро) = Рр) + FECE p = (х – р)/'@(х)), 


donde ¿(x) está entre x у р. Ya que f eC'[a, b]. 
lim PE) = 7 (1m Т) = Fw) #0. 


Haciendo q = f’ o ё obtenemos f(x) = (x — p)q (x), donde 1йтї,_›„ q(x) # 0. Por lo tanto, 
f tiene un cero simple en р. п 


La siguiente generalización del teorema 2.11 se considera en el ejercicio 12. 


La función f € C”[a, b] tiene un cero de multiplicidad т en p en (a, b) si y sólo si 


0= fp) = FP) = Ј"(р) =: = fp), pero FM (p) #0. и 


El resultado en el teorema 2.12 implica que existe un intervalo alrededor de р donde el 
método de Newton converge cuadráticamente а p para cualquier aproximación inicial ро = p, 
siempre que p sea un cero simple. El siguiente ejemplo muestra que la convergencia cuadrá- 
tica podría no presentarse 51 el cero no es simple. 


Sea f(x) = е — x — 1. a) Muestre que f tiene un cero de multiplicidad 2 en x = 0. b) Muestre 
que el método de Newton con py = 1 converge para este cero, pero no de manera cuadrática. 


Solución a) Tenemos 


fao=e—x-1, РО) = e-l, y fU)=e, 
por lo que 
FO0)=e*-0-1=0, f0)=e-1=0, у fFU0=e=1. 


El teorema 2.12 implica que f tiene un cero de multiplicidad 2 en x = 0. 
b) Los primeros dos términos generados por el método de Newton aplicado a f con py = 1 
son 


fo) _,_e-2 


mp Е ~ 0.58198 
„ә; F po) е—1 
у 
0.20760 
p= pi- LP 0.58198 — = 0.31906. 
/'(р\) 0.78957 


Los primeros ocho términos de la sucesión generada por el método de Newton se muestran 
en la tabla 2.8. La sucesión es claramente convergente a 0, pero no cuadráticamente. La grá- 
fica de f se muestra en la figura 2.11. п 
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Figura 2.11 
Tabla 2.8 
п Pn 
0 1.0 
1 0.58198 
2 0.31906 
3 0.16800 
4 0.08635 
5 0.04380 
6 0.02206 
7 0.01107 
8 0.005545 
9 2.7750 x 107° 
10 1.3881 x 107° 
11 6.9411 x 1074 Un método para manejar el problema de raíces múltiples de una función f es definir 
12 3.4703 x 107* 
13 1.7416 x 107* Fx) 
—5 ш(х) = . 
14 8.8041 x 10 fx) 
15 4.2610 x 1075 
16 1.9142 x 10 Si p es un cero de f de multiplicidad m con f(x) = (х — p)”q(x), entonces 
ae (х = pY"g(x) 
m(x — р)"—14(х) + (х — р)" (х) 
q(x) 
= (x — p) 


тд (х) + (x= р) (х) 
también tiene un сего еп р. Sin embargo, q (р) 4 0, por lo que 


q(p) = 1 20, 
ma(p)+(p= pp) т 


y p es un cero simple de u(x). Entonces, el método de Newton se puede aplicar a u(x) para 
proporcionar 

иб) _, Pora 

шх) EOP = [FCI CODA COP” 


g(x) =x 


Lo cual se simplifica en 


FWE) тИ 
EOR- Р) ў") (2.13) 


ga) = х 


Si g tiene las condiciones de continuidad requeridas, la iteración funcional aplicada a 
g será convergente cuadráticamente, sin importar la multiplicidad del cero de f. En teoría 
el único inconveniente de este método es el cálculo adicional de f”(x) y el procedimiento 
más laborioso que consiste en calcular las iteraciones. Sin embargo, en la práctica las raíces 
múltiples pueden causar graves problemas de redondeo debido a que el denominador de la 
ecuación (2.13) consiste en la diferencia de dos números, ambos cerca de 0. 


Ejemplo 2 En el ejemplo 1 se mostró que f(x) = е" — x — 1 tiene un cero de multiplicidad 2 en x = 0 y 
que el método de Newton con ро = 1 converge en este cero, pero no de manera cuadrática. 
Muestre que la modificación del método de Newton, como se indica en la ecuación (2.13) 
mejora la tasa de convergencia. 
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Tabla 2.9 

п Pn 

1 —2.3421061 x 107! 
2 —8.4582788 x 107? 
3 —1.1889524 х 1075 
4 —6.8638230 х 1076 
5 —2.8085217 х 1077 


Ilustración 


Solución El método modificado de Newton da 


f (po) /'(ро) _1 (е — 2)(е—1) 


= дш —2.3421061 х 107!. 
Fo — Fo) Fo) (е — 17 —Се—2)е j 


Pı = ро 


Esto está considerablemente más cerca de O que el primer término al usar el método de Newton, 
que era 0.58918. La tabla 2.9 enumera las primeras cinco aproximaciones para el doble cero 
en x = 0. Los resultados se obtuvieron a partir de un sistema con 10 dígitos de precisión. La 
falta relativa de mejora en las últimas dos entradas se debe al hecho de que al usar este siste- 
ma, tanto el numerador como el denominador se aproximan a 0. Por consiguiente, existe una 
pérdida de dígitos significativos de precisión, conforme las aproximaciones se acercan а 0. 


Lo siguiente ilustra que el método modificado de Newton converge cuadráticamente 
incluso en el caso de un cero simple. 


En la sección 2.2, encontramos que un cero de f(x) = х + 4x? — 10 = Oes p = 1. 36523001. 
Aquí compararemos la convergencia de un cero simple usando tanto el método de Newton 
como el método modificado de Newton, dado en la ecuación (2.13). Sea 


Pii +4p?_, =) 
3р2 +8рл-1 


i) Pn=Pn-1 , a partir del método de Newton, 


y a partir del método modificado de Newton provisto por la ecuación (2.13), 


(р)_\ +4p?_, E 10)(3 p2 +8Pn-1) 
(3р2; +8Pn-1? — (Pi + 4p2_, — 10)(6p,.-1 + 8) 


ii) Pn = Pn-1 


Con po = 1.5, tenemos 
Método de Newton 

рі = 1.37333333, p = 1.36526201, y p3 = 1.36523001. 
Método modificado de Newton 


pı = 1.35689898, р = 1.36519585, y p3 = 1.36523001. 


Ambos métodos son rápidamente convergentes al cero real, el cual es dado por ambos méto- 
dos como p3. Sin embargo, observe que, en el caso de un cero simple, el método original de 
Newton requiere considerablemente menos cálculos. ш 


La sección Conjunto de ejercicios 2.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


FEN 2 2.5 Convergencia acelerada 


El teorema 2.8 indica que es raro tener el lujo de la convergencia cuadrática. Ahora consi- 
deramos una técnica llamada método A? de Aitken, que se puede utilizar para acelerar la 
convergencia de una sucesión que es linealmente convergente, independientemente de su 


origen o aplicación. 


Método A? de Aitken 


Suponga {р}? у es una sucesión linealmente convergente con límite р. Para motivar la 
construcción de una sucesión {n}? o que converge más rápidamente a p que {р„} су 


Alexander Aitken (1895-1967) 
usó esta técnica en 1926 para 
acelerar la tasa de convergencia 
de una serie en un artículo sobre 
ecuaciones algebraicas [Ai]. 
Este proceso es similar al que 
usó mucho antes el matemático 
japonés Takakazu Seki Kowa 
(1642-1708). 


Ejemplo 1 

Tabla 2.10 
п Pn Р, 
1 0.54030 0.96178 
2 0.87758 0.98213 
3 0.94496 0.98979 
4 0.96891 0.99342 
5 0.98007 0.99541 
6 0.98614 
7 0.98981 

Definición 2.13 
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suponga que los signos de pa — р, Pn+1 — р, У Pn+2 — р concuerdan y que n es suficiente- 
mente grande para que 


Pn4+1 — P y Pn42 — р 
Рп = р Pn+1 — P 


Entonces 
(Pri — Р)? ~ (риз — P)(Pr — Р), 
por lo que 
Pigi — 2Pas1 P + р? ™ разра — (Pr + Pn+2)p + р? 
y 


(рһ+2 + Pa = 2рп+1)р X рп+2 рп — Р 


Al resolver р obtenemos 


x Pn+2Pn 7 Pa 
Pn+2 — 2Pn+1 + Pn 


Al sumar y restar los términos p? y 2PrPn+1 en el numerador y agrupar los términos ade- 
cuadamente obtenemos 


a Рпрп+2 — 2PnPn+1 F p? = Pai + 2PnPn+1 = р 
Pn42 7 2рп+1 + Pn 


р 


Рп (Pn+2 = 2Pn41 + рп) — (В. = 2PnPn+1 + р?) 
Pn+2 ~ 2Pn+1 + Pn 
(Pn+1 = рл)? 
Pn+2 — 2рп+1 + Pn 


= Pn 


El método A? de Aitken se basa en la suposición de que la sucesión definida por (PJ 2. 


Р = р (Pr+1 БЫ ры)” 
" " Pn+2 — 2Pn41 + Pn i 


(2.14) 


converge más rápidamente a р que la sucesión original {Pn}n=0- 


La sucesión {pn}, donde р, = cos(1/n), converge linealmente a р = 1. Determine los 


primeros cinco términos de la sucesión provista por el método A? de Aitken. 


Solución Соп el fin de determinar el término ), de la sucesión con el método A? de Aitken, 
necesitamos tener los términos р,, Pn+1» Y Pn+2 de la sucesión original. Por lo tanto, para 
determinar рз, necesitamos los primeros siete términos de {р}. Estos se muestran en la tabla 
2.10. Ciertamente, parece que [Pn);_, converge más rápido a p = 1 que {р}. ш 


La notación A relacionada con esta técnica tiene su origen еп la siguiente definición. 


Para una sucesión { р„}° determinada, la diferencia hacia adelante Ap, (que se lee “delta 
рт”) se define mediante 


Apn = Pn+1 — Pn, paran > 0. 
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Teorema 2.14 


Johan Frederik Steffensen (1873— 
1961) escribió un prestigioso 
libro titulado Interpolation en 
1927. 


Las potencias superiores del operador А se definen de manera recursiva con 


А*р„ = MAR pa), parak>2. Е 


La definición implica que 


A? pr = A(Pn+1 > Pn) = Арп = Ар, = (Pn +2 Pn4 1) (Pn Pl Pn). 


Por lo que A? p, = Pn+2 — 2Pn+1 + рп, y la fórmula para р, determinada en la ecuación 
(2.14) se puede escribir como 


2 
Pa h ei: (2.15) 
A? pn 
En este punto de nuestro análisis del método A? de Aitken, hemos establecido que la 
sucesión {n} converge a р más rápidamente que la sucesión original { р„}?° (, pero no 
hemos dicho lo que significa el término convergencia “más rápida”. El teorema 2.14 explica 
y justifica esta terminología. La prueba de este teorema se considera en el ejercicio 16. 


Suponga que {р }2 (, es una sucesión que converge linealmente en el límite р y que 


2 Рп+1 = р 
lím <l 
n—>00 Pn = Р 


Entonces la secuencia А? de Aitken { р, )2 converge а p más rápido que { р, }2 en el sen- 
tido en que 
lí Ên — P 
ím 
n—>00 Pn —_ Р 


= 0. ш 


Método de Steffensen 


Al aplicar una modificación del método A? de Aitken a una sucesión linealmente convergen- 
te obtenida a partir de la iteración de punto fijo, podemos acelerar la convergencia a cuadrá- 
tica. Este procedimiento recibe el nombre de método de Steffensen y difiere ligeramente de 
la aplicación del método A? de Aitken directamente para la sucesión de iteración de punto 
fijo linealmente convergente. El método A? de Aitken construye los términos en el orden: 


ро, рі = &(ро), p2=8(p), Ро = {А?}(ро), 


рз = (р), Îi = (Ар), ..., 


donde { A?) indica que se usa la ecuación (2.15). El método de Steffensen construye los 
primeros cuatro términos ро, pı, P, y Po. Sin embargo, en este paso suponemos que ро es una 
mejor aproximación a р que es р, y aplicamos la iteración de punto fijo a ро en lugar de a p,. 
Con esta notación, la sucesión generada es 


(0) 0 (0 0 (0 a (0) (d) 1 
ро, р? = (р), р =g), pP = {А2} 0р0), pP =g... 


Cada tercer término de la sucesión de Steffensen se genera con la ecuación (2.15); los 
otros usan la iteración de punto fijo en el término previo. El proceso se describe en el 
algoritmo 2.6. 


Ilustración 


Tabla 2.11 
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Método de Steffensen 


Para encontrar una solución para p = g(p) dada una aproximación po: 

ENTRADA aproximación inicial ре tolerancia TOL; número máximo de 
iteraciones No. 

SALIDA aproxime la solución p o mensaje de falla. 

Paso 1 Determine i = 1. 

Paso 2 Mientras i < No haga los pasos 3-6. 


Paso З Determine pı = g (po); (Calcule pË”) 


p2 = 2(pı); (Calcule p") 


р = Po — (ру — po)? /(p2 — 2pı + po). (Calcule р?) 


Paso 4 Si |р — pol < TOL entonces 
SALIDA (p), (Procedimiento completado exitosamente.) 
PARE. 


Paso 5 Determine i = і +1. 
Paso 6 Determine po = p. (Actualice po.) 


Paso 7 SALIDA (“El método falló después de Ny iteraciones, No =’, No); 
(Procedimiento no completado exitosamente.) 
PARE. п 


Observe que А? р„ podría ser 0, que introducirá un O en el denominador de la siguiente 
. б А è F . —1 . 
iteración. Si esto pasa, terminamos la sucesión y seleccionamos рї ) como la mejor apro- 
ximación. 


Para resolver x? + 4х2 — 10 = 0 con el método de Steffensen, si х + 4? = 10, divida entre 
x + 4 y resuelva para x. Este procedimiento crea el método de punto fijo 


10 1/2 
g(x) = (=) . 


Consideramos el método de punto fijo en la tabla 2.2, columna d) de la sección 2.2. 

Al aplicar el procedimiento de Steffensen con ро = 1.5 obtenemos los valores еп la ta- 
bla 2.11. La iteración Р? = 1.365230013 es exacta hasta el noveno lugar decimal. En este 
ejemplo, el método de Steffensen ofrece casi la misma precisión que el método de Newton 
aplicado a este polinomio. Estos resultados se pueden observar en la ilustración al final de 


la sección 2.4. п 
k ро р р? 
0 ру” pP =в(ру) pP =g) 
(P = ру)? a) a) a) a) 
1 рр =p рі = 8(р0) ру =g) 
р” = 2р1? + po” 
1 1 
2 р® Е po (р\ )— ро Y 
o = ро 
pP = 2p% + р? 
Lo cual produce la siguiente tabla 
0 15 1.348399725 1.367376372 
1 1.365265224 1.365225534 1.365230583 


2 1.365230013 
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A partir de la ilustración, parece que el método de Steffensen provee convergencia cua- 
drática sin evaluar una derivada y el teorema 2.14 establece que éste es el caso. La demostra- 
ción de este teorema se puede encontrar en [He2], pp. 90-92 o [IK], pp. 103-107. 


Teorema 2.15 Suponga que x = g(x) tiene la solución р con g'(p) # 1. Si existe una ô > 0 tal que g e С? 


[р — ô, p + б], entonces el método de Steffensen proporciona convergencia cuadrática para 
cualquier po € [p — ô, p + д]. E 


La sección Conjunto de ejercicios 2.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 2 2.6 Ceros de polinomios y método de Müller 


Teorema 2.16 


Ejemplo 1 


Carl Friedrich Gauss (1777— 
1855), uno de los más grandes 
matemáticos de todos los 
tiempos, demostró el teorema 
fundamental de álgebra en 

su tesis doctoral y lo publicó 

en 1799. Publicó diferentes 
demostraciones de este resultado 
a lo largo de su vida, en 1815, 
1816 y hasta en 1848. El 
resultado fue establecido, sin 
demostración, por Albert Girard 
(1595-1632), y Jean а Alembert 
(1717-1783), Euler y Lagrange 
aportaron pruebas parciales. 


Un polinomio de grado n tiene la forma 


P(x) = anx” ЕЕ т +++ ах + ао, 


donde las а;, llamadas coeficientes de P, son constantes y а, 5 O. La función сего Р(х) = 0 
para todos los valores de x se considera un polinomio, pero no tiene un grado asignado. 


Polinomios algebraicos 


(Teorema fundamental de álgebra) 


Si P(x) es un polinomio de grado n > 1 con coeficientes reales o complejos, entonces Р(х) 
= 0 tiene por lo menos una raíz (posiblemente compleja). п 


A pesar de que el teorema fundamental de álgebra es básico para cualquier estudio de 
las funciones elementales, la prueba usual requiere técnicas a partir del estudio de la teoría 
de función compleja. El lector puede consultar [SaS], p. 155, para la culminación de un de- 
sarrollo sistemático de los temas necesarios para mejorar este teorema. 


Determine todos los ceros del polinomio P(x) = X = 522 + 17x — 13. 


Solución Es muy fácil verificar que P(1) = 1 — 5 + 17 — 13 = 0, por lo que x = 1 es un 
cero de P y (x — 1) es un factor del polinomio. Al dividir P(x) entre x — 1 obtenemos 


Р(х) = (x — 1) (x? — 4х + 13). 


Para determinar los ceros de x? — 4x + 13, usamos la fórmula cuadrática en su forma están- 
dar, la cual da los ceros complejos 


—(—4) + VC — 4(1)(13) _ 4+ /—36 


200) 2 


= 22636 


Por Іо tanto, el polinomio de tercer grado Р(х) tiene tres ceros, ху = 1, x2 = 2 — 31 y x2 = 
2 + 31. m 


En el ejemplo anterior, encontramos que el polinomio de tercer grado tiene tres ceros 
diferentes. Una consecuencia importante del teorema fundamental de álgebra es el siguiente 
corolario. Establece que éste siempre es el caso con la condición de que cuando los ceros no 
son distintos, contamos el número de ceros de acuerdo con sus multiplicidades. 
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Corolario 2.17 51 Р(х) es un polinomio de grado п > 1 con coeficientes reales o complejos, entonces existen 


Corolario 2.18 


William Horner (1786-1837) era 
un niño prodigio que se convirtió 
en maestro de una escuela 

en Bristol a los 18 años. El 
método de Horner para resolver 
ecuaciones algebraicas se publicó 
en 1819 en las Philosophical 
Transactions of the Royal Society 
(Transacciones filosóficas de la 
Real Sociedad). 


Teorema 2.19 


Paolo Ruffini (1765-1822) 
describió un método similar que 
lo hizo merecedor de la medalla 
de oro de la Italian Mathematical 
Society for Science (Sociedad 
Matemática Italiana para la 
Ciencia). Ni Ruffini ni Horner 
fueron los primeros en descubrir 
este método; ya se conocía en 
China 500 años antes. 


constantes únicas х], х2, ..., Xk, posiblemente complejas y enteros positivos únicos mı, m, 
k 
.. ть tal que >» ут = пу 


Р(х) = ап(х — 1)" (a — 1220 (х xp)". m 


Mediante el corolario 2.17, la colección de ceros de un polinomio es única y, si cada 
cero x; se cuenta tantas veces como su multiplicidad m;, un polinomio de grado n tiene exac- 
tamente n ceros. 

El siguiente corolario del teorema fundamental de álgebra se usa con frecuencia en esta 
sección y en capítulos posteriores. 


Sean Р(х) y Q(x) polinomios de grado a lo más n. Si xj, хо, ..., X% con k > n, son números dis- 

tintos con P(x) = О(х) para i = 1, 2,..., k, entonces Р(х) = Q(x) para todos los valores de x. 

ш 

Este resultado implica que para mostrar que dos polinomios de grado menor o igual que 

n son iguales, sólo necesitamos mostrar que concuerdan en n + 1 valores. Esto se usará con 
mucha frecuencia, especialmente en los capítulos 3 y 8. 


Método de Horner 


Al usar el método de Newton para localizar los ceros aproximados de un polinomio P(x), 
necesitamos evaluar Р(х) y Р'(х) en valores específicos. Puesto que tanto Р(х) como Р'(х) 
son polinomios, la eficiencia computacional requiere que la evaluación de estas funciones se 
realice de la manera anidada que se analiza en la sección 1.2. El método de Horner incorpora 
esta técnica anidada y como consecuencia, sólo requiere n multiplicaciones y n sumas para 
evaluar un polinomio de enésimo grado. 


(Método de Horner) 


Sea 
Р(х) Hanix a Eag: 
Defina Б, = а, y 
bk = ak + Бахо, parak =n -—1,n—2,...,1,0. 
Entonces Ро = P (xo). Además, si 
О(х) = bax"! +„Б„_ух" 7? box + bi, 
Entonces 


Р(х) = (х — хо) Q (x) + bo. 


Demostración Por la definición de Q(x), 
(х — xo) Q (Œ) + bo = (х — xo) (bnx"™! + -- -+ bax + Б) + bo 
= (bpx? + baix"! +--+ bax? + bix) 
— (bnxox”! + >> + Бухух + bixo) + bo 
= bax” + (Ба 1 — baxo! + --- + (bı — bzxo)x + (bo — Рахо). 
Por la hipótesis, b, = an y bk — рахо = ax, por lo que 


(х = хо) О(х) + bo = Р(х) y bo = Р(х). ш 
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Ejemplo 2 Use el método de Horner para evaluar Р(х) = 2x* 


La palabra “sintético” tiene sus 
raíces en diferentes lenguajes. 
En inglés estándar, por lo general 
provee un sentido de algo 

que es “falso” o “sustituido”. 

Sin embargo, en matemáticas 
toma la forma de algo que 

está “agrupado”. La geometría 
sintética trata las formas como 
un todo en lugar de cómo objetos 
individuales, que es como se 

usa en geometría analítica. En la 
división sintética de polinomios, 
las diferentes potencias de las 
variables no se proporcionan 

de modo explícito, pero se 
mantienen juntas. 


Ejemplo 3 


= Soluciones de las ecuaciones en una variable 


3x? + Зх — 4епхо = —2. 


Solución Cuando usamos el cálculo manual en el método de Horner, primero construimos 
una tabla que sugiere el nombre de la división sintética, que a menudo se aplica a esta técnica. 


Para este problema, la tabla aparece a continuación: 


Coeficiente Coeficiente Coeficiente Coeficiente Término 
de xt de x? de x? dex constante 
хо = =2 а4 = 2 аз = 0 а = —3 а = 3 dy = —4 
Рахо = —4 Рзхо = 8 baxo = —10 bixo = 14 
ра = 2 Рз = —4 b: = 5 bi = —7 ро = 10 
Por lo que, 


Р(х) = (х + 2)(2х° — 4х2 + 5x — 7) + 10. 


Una ventaja adicional del uso del procedimiento de Horner (o de división sintética) es 


que, ya que 
Р(х) = (х — хо) О(х) + bo, 
donde 
О(х) = bax"! + brix"? +--+ box + bi, 
al diferenciar respecto a x obtenemos 


Рх) = О(х) + (x—x0)0'(x) у P'(xo) = Об). 


(2.16) 


Cuando el método de Newton-Raphson se usa para encontrar un cero aproximado de un 


polinomio, Р(х) y Р'(х) se puede evaluar de la misma forma. 


Encuentre una aproximación al cero de 


Р(х) = 2х* — 3x? + 3x — 4, 


usando el método de Newton con xy = —2 y la división sintética para evaluar P(x,) y Р'(х„) 


para cada iteración х„. 


Solución Con xy = 


mediante 
xo = —2 2 0 —3 3 —4 
—4 8 —10 14 
2 —4 5 —7 10 = P(-2). 
Usando el teorema 2.19 y la ecuación (2.16), 
О(х) = 2х3 – 4x? +5x—-7 у Р(-2) = 0(-2), 


por lo que P'(—2) se puede encontrar al evaluar O(—2) en forma similar: 


wm=-2 | 2 -4 5 =. 
—4 16 -4 
2 -8 2 -49 =0(—2)=Р'(—2) 


—2 como aproximación inicial, obtuvimos P(—2) en el ejemplo 1 
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y 
Р P 10 
A к E 
Р'(хо) О(хо) —49 
Al repetir el procedimiento para encontrar х obtenemos 
—1.796 2 0 —3 3 —4 
—3.592 6.451 —6.197 5.742 
2 —3.592 3.451 —3.197 1.742 = P(x1) 
3.592 12.902 —29.368 
2 —7.184 16.353 — 32.565 = 0O(x1) = P' (xi). 
Por lo que, P(—1.796) = 1.742, P'(-1.796) = О(—1.796) = —32.565, y 
= —1.796 Ui ы 1.7425 
= —32565 77 
De manera similar, хз = — 1.73897, y un cero real con cinco cifras decimales es — 1.73896. 
Observe que el polinomio Q(x) depende de la aproximación que se usa y cambia de una 
iteración a otra. ш 
El algoritmo 2.7 calcula Р(хо) y Р'(хо) usando el método de Horner. 
Método de Horner 
Para evaluar el polinomio 
Р(х) = anx" + anx"! +- Бах + ау = (х — xo) О(х) + bo 
Y su derivada en хо: 
ENTRADA grado n; coeficientes ao, a1, ... , An; Хо. 
SALIDA y = P(xo); z = P'(xo). 
Paso 1 Determine y = a,; (Calcule „рага P.) 
Zz =an. (Calcule b„—ı para Q.) 
Paso 2 Paraj=n—1,n-2,...,1 
determine y = хоу + aj; (Calcule b ; para P.) 
2= хог + y. (Calcule b;_, para Q.) 
Paso З Determine y = хоу + ао. (Calcule by para P.) 
Paso 4 SALIDA (у, 2); 
PARE. a 


Si la enésima iteración, x,, en el método de Newton es un cero aproximado para P, 


entonces 


Р(х) = (х — хм) О(х) + bo = (х — хм) О(х) + P (xn) ¥ (x — xy)O(x). 


Por lo que, x — xy es un factor aproximado de P(x). Suponiendo que ў = xy sea el cero 


aproximado de P y Qı (x) = Q(x) sea el factor aproximado obtenemos 


Р(х) (4 — X1)01(x). 


Podemos encontrar un segundo cero aproximado de P al aplicar el método de Newton para 


Qix). 
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Teorema 2.20 


El método de Miiller es similar 
al método de la secante. Sin 
embargo, mientras en el método 
de la secante se usa una recta que 
pasa por dos puntos en la curva 
para aproximar la raíz, en el 
método de Miiller se utiliza una 
parábola a lo largo de tres puntos 
en la curva para la aproximación. 


Si P(x) es un polinomio de enésimo grado con n ceros reales, este procedimiento aplica- 
do repetidamente al final resultará en (n — 2) ceros aproximados de P y un factor cuadrático 
aproximado О„—2(х). En esta etapa, О„—2(Х) = 0 puede resolverse con la fórmula cuadrá- 
tica para encontrar por lo menos dos ceros aproximados de Р. А pesar de que este método se 
puede usar para encontrar todos los ceros aproximados, depende del uso repetido de aproxi- 
maciones y puede conducir a resultados imprecisos. 

El procedimiento que se ha descrito recientemente recibe el nombre de deflación. La 
dificultad de la precisión con deflación se debe al hecho de que, cuando obtenemos los ceros 
aproximados de P(x), el método de Newton se usa en el polinomio reducido Q(x), es decir, 
el polinomio que tiene la propiedad de que 


Р(х) ~ (х — Ўу)(х — 22) +++ (a — ĉr) 01 (x). 


Un cero aproximado „+1 de Oz por lo general no se aproximará a la raíz de Р(х) = 0, como 
lo hace una raíz de la ecuación reducida Оџ(х) = 0 y la imprecisión aumenta conforme lo 
hace k. Una forma de eliminar esta dificultad es usar las ecuaciones reducidas para encontrar 
las aproximaciones 2,33, ... , Xy para los ceros de Р y, a continuación, mejorar estas apro- 
ximaciones al aplicar el método de Newton al polinomio original P(x). 


Ceros complejos: método de Müller 


Un problema con la aplicación de los métodos de la secante, de posición falsa o de Newton a 
los polinomios, es la posibilidad de que el polinomio tenga raíces complejas incluso cuando 
todos los coeficientes son números reales. Si la aproximación inicial es un número real, todas 
las aproximaciones subsiguientes también serán números reales. Una forma de superar esta 
dificultad es comenzar con una aproximación inicial compleja y realizar todos los cálculos 
con aritmética compleja. Un enfoque alterno tiene sus bases en el siguiente teorema. 


Siz = a + bi es un cero complejo de multiplicidad m del polinomio P(x) con coeficientes 
reales, entonces z = а — bi también es un cero de multiplicidad m del polinomio Р(х) y 
(х2 — 2ax + а? + Ь?\" es un factor de Р(х). п 


Una división sintética mediante polinomios cuadráticos se puede concebir рага factori- 
zar aproximadamente el polinomio, de modo que un término será un polinomio cuadrático 
cuyas raíces complejas son aproximaciones a las raíces del polinomio original. Esta técnica 
se describió con cierto detalle en nuestra segunda edición [BFR]. En lugar de proceder con 
estas líneas, ahora consideraremos un método, que D. E. Miiller [Mu] presentó primero. Esta 
técnica se puede usar para cualquier problema de encontrar la raíz, pero es especialmente útil 
para aproximar las raíces de los polinomios. 

El método de la secante comienza con dos aproximaciones iniciales ро y pı y determi- 
na la siguiente aproximación p2, como la intersección del eje x con la recta que pasa por 
(ро, /(ро)) y (рь f(p1)). (Consulte la figura 2.12a).) En el método de Müller se usan tres 
aproximaciones iniciales, po, pı y pọ y determina la siguiente aproximación рз al considerar 
la intersección del eje x con la parábola a través de (ро, f(po)), (Pi F(p1)) y (pa, f(p2)). (Con- 
sulte la figura 2.12b).) 
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Figura 2.12 


La derivación del método de Müller comienza al considerar el polinomio cuadrático 
Р(х) = а(х — рз)? +b(x — ро) + с 


que pasa a través de (po, /(ро)), (Рт, f (P1)), y (P2, f (p2)). Las constantes а, b y c se pue- 
den determinar a partir de las condiciones 


F(po) = а(ро — ро)? + Ь(ро — рә) + с, (2.17) 
/ (р) = а(ру = ро)? +b(pi — p) + с, (2.18) 
y 
fp) =а: Ф +ь.0 +с= с (2.19) 
рага ѕег 
с = } (ро), (2.20) 
р (а= PISO) = F) — (рі — ро)? (ро) — Fp) 221) 
(po = p2)(pı — рә)(ро — pı) i | 
у 
реа (рі = р2)[ (ро) — f (p2)] — (ро = р) (рі) — FPI (222) 


(ро = рә)(ру = рә)(ро — P1) 


Para determinar рз, un cero de P, aplicamos la fórmula cuadrática para Р(х) = 0. Sin em- 
bargo, debido a los problemas de error de redondeo causados por la resta de los números 
casi iguales, aplicamos la fórmula en la manera prescrita en las ecuaciones (1.2) y (1.3) de 
la sección 1.2: 


—2c 
A ERE Aag 


Esta fórmula proporciona dos posibilidades para p3, dependiendo del signo que precede al 
término radical. En el método de Müller, el signo se selecciona de acuerdo con el signo de b. 
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Elegido de esta forma, el denominador será el más grande en magnitud y resultará en p3 
siendo seleccionado como el cero más cercano de P para p2. Por lo tanto, 


2c 
pam pe b + sgn (b) Vb? — Дас’ 


donde a, b y c se obtienen de las ecuaciones (2.20) a (2.22). 

Una vez que se determina рз, el procedimiento se reinicializa usando р, p2 y рз en lu- 
gar de po, pı y p2 para determinar la siguiente aproximación, p4. El método continúa hasta 
obtener una conclusión satisfactoria. En cada paso, el método implica el radical Vb? — 4ac, 
рог lo que el método proporciona raíces complejas aproximadas cuando b° — 4ac < 0. 
El algoritmo 2.8 implementa este procedimiento. 


Método de Múller 


Para encontrar una solución para f(x) = O dadas las tres aproximaciones Po, pı Y p2: 
ENTRADA po, pı, pa tolerancia TOL; número máximo de iteraciones No. 
SALIDA solución aproximada p o mensaje de falla. 
Paso 1 Determine hı = pı — ро; 

ha = P2— Pi; 

ôi = (f (p1) — /(ро))/ №; 

ô2 = (f (p2) — }(р1))/ M; 
d = (8› — ô1)/ (h2 + hı); 
= 3. 


1 == 
Paso 2 Mientras і < Ny haga los pasos 3—7. 
Paso 3 b = ô + hd; 
D = (b? —4f(p2d)'?. (Nota: puede requerir aritmética compleja.) 


Paso 4 Silb— р| < |b + D| entonces determine E = b + D 
también determine E = b — D. 
Paso 5 Determine h = —2 f (p2)/E; 
p=p2+h. 


Paso 6 Silh| < TOL entonces 
SALIDA (p); (El procedimiento fue exitoso.) 


PARE. 
Paso 7 Determine po = pi; (Prepare la siguiente iteración.) 
P1= ро; 
P2 = P; 
hı = pı — ро; 
h = p — Ppi; 


81 = (f (p1) — /(ро))/ 1; 
82 = (f (p2) — f (p1))/ħ2; 
d = (8, — ô1)/(h2 + hı); 
i=i+l. 
Paso 8 SALIDA (“El método falló después de Ny iteraciones, No =”, No); 
(El procedimiento no fue exitoso.) 
PARE. п 


Ilustración 


Figura 2.13 


Tabla 2.12 


Tabla 2.13 


26 Сегоѕ de polinomios y método de Müller 


15 


Considere el polinomio f(x) = xf — Зх? + x? + x + 1, cuya gráfica se muestra en la figura 


2.13. 


Tres conjuntos de tres puntos iniciales se usarán con el algoritmo 2.8 у TOL = 10”? рага 
aproximar los ceros de f. El primer conjunto usará ро = 0.5, pi = —0.5 y p2 = 0. La parábola 
que pasa a través de estos puntos tiene raíces complejas porque no interseca el eje x. La tabla 
2.12 provee aproximaciones para los ceros complejos correspondientes de f. 


ро = 0.5, р 


i Pi 


© со 3 с UB о 


—0.100000 + 0.888819; 
—0.492146 + 0.447031i 
—0.352226 + 0.4841321 
—0.340229 + 0.443036 
—0.339095 + 0.446656 
—0.339093 + 0.4466301 
—0.339093 + 0.4466301 


—0.5, р =0 
f (pi) 


—0.01 120000 + 3.0148755481 
—0.1691201 — 0.7367331502i 
—0.1786004 + 0.01818722131 
0.01197670 — 0.01055621851 
—0.0010550 + 0.000387261i 


0.000000 + 0.000000/ 
0.000000 + 0.000000/ 


La tabla 2.13 nos da aproximaciones para los dos ceros reales de f. El más pequeño de 
éstos usa ро = 0.5, pi = 1.0 y р = 1.5, y la raíz más grande se aproxima cuando ро = 1.5, 


pi~ 20 yp = 2:9. 


po = 0.5, р= 1.0, р = 1.5 ро = 1.5, р p = 2.5 
і Pi Fr) i Pi / (р) 
3 1.40637 —0.04851 3 2.24733 —0.24507 
4 1.38878 0.00174 4 2.28652 —0.01446 
5 1.38939 0.00000 5 2.28878 —0.00012 
6 1.38939 0.00000 6 2.28880 0.00000 

7 2.28879 0.00000 


Los valores en las tablas son aproximaciones precisas para los lugares enumerados. 
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La ilustración muestra que el método de Müller puede aproximar las raíces de los poli- 
nomios con una variedad de valores iniciales. De hecho, el método de Müller por lo general 
converge con la raíz de un polinomio para cualquier selección de aproximación inicial, a 
pesar de que se pueden construir problemas para los cuales la convergencia no se presenta- 
rá. Por ejemplo, suponga que para algunas i tenemos f (p;i) = f(Pi+ı) = (ро) A 0. 
Entonces, la ecuación cuadrática se reduce a una función constante diferente de cero y nunca 
interseca el eje x. Sin embargo, esto no es normalmente el caso, y los paquetes de software 
de propósito general que usan el método de Müller sólo requieren una aproximación inicial 
por raíz e incluso proporcionarán esta aproximación como una opción. 


La sección Conjunto de ejercicios 2.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Software numérico y revisión del capítulo 


Dada una función específica f y una tolerancia, un programa eficiente debería producir una 
aproximación para una o más soluciones de f(x) = 0, cada una tiene un error absoluto o 
relativo dentro de la tolerancia y los resultados deberían generarse en una cantidad razonable 
de tiempo. Si el programa no puede realizar esta tarea, por lo menos debería proporcionar 
explicaciones lógicas de porqué no se consiguió el éxito y una indicación sobre cómo reme- 
diar la causa de la falla. 

IMSL tiene subrutinas que implementan el método de Miiller con deflación. En este 
paquete también se incluye una rutina debida a R. P. Brent en la que se usa una combinación 
de interpolación lineal, una interpolación cuadrática inversa similar al método de Müller y el 
método de bisección. El método de Laguerre también se usa para encontrar los ceros de un 
polinomio real. Otra rutina para encontrar los ceros de los polinomios reales usa el método 
de Jenkins—Traub, que también sirve para encontrar los ceros de un polinomio complejo. 

La biblioteca NAG tiene una subrutina que usa una combinación del método de bisec- 
ción, la interpolación lineal y la extrapolación para aproximar un cero real de una función en 
un intervalo determinado. NAG también provee subrutinas para aproximar todos los ceros 
de un polinomio real o complejo, respectivamente. Ambas subrutinas usan un método de 
Laguerre modificado. 

La biblioteca netlib contiene una subrutina que usa una combinación de los métodos 
de bisección y de secante desarrollada por T. J. Dekker para aproximar un cero real de la 
función en el intervalo. Requiere especificar un intervalo que contiene una raíz y regresa un 
intervalo con un ancho que se encuentra dentro de una tolerancia específica. Otra subrutina 
usa una combinación del método de bisección, la interpolación y la extrapolación para en- 
contrar un cero real de la función en el intervalo. 

Observe que a pesar de la diversidad de los métodos, los paquetes escritos de manera 
profesional están basados principalmente en métodos y principios que se analizan en este 
capítulo. Usted debería ser capaz de utilizar estos paquetes al leer los manuales adjuntos para 
comprender mejor los parámetros y las especificaciones de los resultados obtenidos. 

Existen tres libros que consideramos clásicos para la solución de ecuaciones no linea- 
les, los de Traub [Tr], de Ostrowski [Os] y de Householder [Ho]. Además, el libro de Brent 
[Bre] sirvió como base para muchos de los métodos para encontrar la raíz que se usan en la 
actualidad. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Interpolación y aproximación polinomial 


Introducción 


Se realiza un censo de la población de Estados Unidos cada 10 años. La siguiente tabla 
muestra la población, en miles de personas, desde 1960 hasta 2010, y los datos también se 
representan en la figura. 


Año | 1960 | 1970 | 1980 | 1990 | 2000 | 2010 
Población | 179323 | 203302 | 226542 | 249633 | 281422 | 308746 
(en miles) | | | | | | 
PO A 
3 x 108 + . 
o 
е 
е 
2х 10% + Ы 
= е 
5 
Е 
© 
o 
A 
1х 108 + 
ОНР НИЧ 
1960 1970 1980 1990 2000 2010 1 
Año 


Al revisar estos datos, podríamos preguntar si se podrían usar para efectuar un cálculo 
razonable de la población, digamos, en 1975 o incluso en el año 2020. Las predicciones de 
este tipo pueden obtenerse por medio de una función que se ajuste a los datos proporcio- 
nados. Este proceso recibe el nombre de interpolación y es el tema de este capítulo. Este 
problema de población se considera a lo largo del capítulo y en los ejercicios 19 de la sección 
3.1, 17 de la sección 3.3 y 24 de la sección 3.5. 
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A 3.1 


Figura 3.1 


Teorema 3.1 


A menudo, se hace referencia a 
Karl Weierstrass (1815-1897) 
como el padre del análisis 
moderno debido a su insistencia 
sobre el rigor en la demostración 
de resultados matemáticos. Fue 
fundamental para el desarrollo 
de pruebas de convergencia de 
series y para determinar formas 
de definir rigurosamente los 
números irracionales. Fue el 
primero en demostrar que una 
función podría ser continua en 
todas partes, pero diferenciable 
en ninguna parte, un resultado 
que escandalizó a algunos de sus 
contemporáneos. 


= Interpolación y aproximación polinomial 


Interpolación y el polinomio de Lagrange 


Una de las clases más útiles y conocidas de funciones que mapean el conjunto de números 
reales en sí mismo son los polinomios algebraicos, el conjunto de funciones de la forma 


P, (x) = anx” F &—1х” а + аб» 


donde n es un entero positivo y ао, ..., an SON constantes reales. Una razón de su importancia 
es que se aproximan de manera uniforme a las funciones continuas. Con esto queremos decir 
que dada una función, definida y continua sobre un intervalo cerrado y acotado, existe un 
polinomio que está tan “cerca” de la función dada como se desee. Este resultado se expresa 
con precisión en el teorema de aproximación de Weierstrass (consulte la figura 3.1). 


Р у=) + є 
ш У РО) 
у =f) 
2 У = ЈО) – є 
A 


(Teorema de aproximación de Weierstrass) 
Suponga que f está definida y es continua en [a, b]. Para cada є > 0, existe un polinomio 
P(x), con la propiedad de que 

56) — Pœ) < є, 


рага todas las х en [a, b]. п 


La prueba de este teorema se puede encontrar en la mayoría de los textos básicos sobre 
análisis real (consulte, por ejemplo, [Bart], pp. 165-172). 

Otra razón importante para considerar la clase de polinomios en la aproximación de 
funciones es que la derivada y la integral indefinida de un polinomio son fáciles de determi- 
nar y también son polinomios. Por esta razón, a menudo se usan polinomios para aproximar 
funciones continuas. 

Los polinomios de Taylor se presentaron en la sección 1.1, donde se describieron como 
uno de los componentes básicos del análisis numérico. Debido a su importancia, se podría 
esperar que la aproximación polinomial usará estas funciones en gran medida; sin embargo, 
éste no es el caso. Los polinomios de Taylor concuerdan tanto como es posible con una 
función dada en un punto específico, pero concentran su precisión cerca de ese punto. Un 
buen polinomio de aproximación debe dar precisión relativa sobre un intervalo completo y, 
en general, los polinomios de Taylor no lo hacen. Por ejemplo, suponga que calculamos los 


Se publicó muy poco del trabajo 
de Weierstrass durante su vida; 
no obstante, sus conferencias, 
en especial sobre la teoría de las 
funciones, influyeron de manera 
significativa en una generación 
completa de estudiantes. 


Figura 3.2 


Tabla 3.1 
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primeros seis polinomios de Taylor alrededor de хо = 0 para f(x) = e”. Ya que las derivadas 
de f(x) son todas e”, que evaluadas en хо = 0 dan 1, los polinomios de Taylor son 


х? х? x’ 

Р(х) = 1, P(G)=1+x, Биа SIA A 
x? х3 xí x? х3 xí x5 
Р(х) =1 саре ч Ps(x) = 1 | 
4 (x) id al 7. y Р5(х) ERE TA 


Las gráficas de los polinomios se muestran en la figura 3.2 (observe que incluso para 
los polinomios de grado más alto, el error empeora progresivamente conforme nos alejamos 
de cero). 


Aunque se obtienen mejores aproximaciones para f(x) = е* si se usan polinomios de 
Taylor, esto no es verdad para todas las funciones. Considere, como un ejemplo extremo, 
usar la expansión en polinomios de Taylor de diferentes grados para f(x) = 1/x alrededor de 
хо = 1 para aproximar f(3) = 1/3. Puesto que 


fs. fæ) =x, f'E) tE? 
y, en general, 
fP (к) = (Cik, 


los polinomios de Taylor son 


n (k) n 
Р(х) =>) D yei AOD a - 1). 
k=0 


Para aproximar f (3) = 1/3 mediante Р„(3) para valores cada vez mayores de n, obtenemos 
los valores en la tabla 3.1 (¡un terrible fracaso!). Cuando aproximamos f (3) = 1/3 mediante 
P,(3) у para valores más grandes de n, la aproximación se vuelve cada vez más imprecisa. 


CAPÍTULO 3 = Interpolación y aproximación polinomial 


Ejemplo 1 


Para los polinomios de Taylor, toda la información que se usa en la aproximación se 
concentra en el único número хо, por lo que, en general, éstos darán aproximaciones impre- 
cisas conforme nos alejamos de хо. Esto limita la aproximación de polinomios de Taylor a 
situaciones en las que las aproximaciones sólo se necesitan en números cercanos a хо. Para 
propósitos computacionales ordinarios, es más eficiente usar métodos que incluyan infor- 
mación en varios puntos. Consideramos esto en el resto del capítulo. El uso principal de los 
polinomios de Taylor en el análisis numérico no tiene propósitos de aproximación, sino la 
derivación de técnicas numéricas y el cálculo de errores. 


Polinomios de interpolación de Lagrange 


El problema de determinar un polinomio de grado uno que pasa por diferentes puntos (xo, уо) 
y (хі, у) es igual al de aproximar una función f para la que f(xo0) = yo y f(x1) = yı por medio 
de un polinomio de primer grado que se interpola, o que coincida con los valores de f en 
los puntos determinados. El uso de estos polinomios para aproximación dentro del intervalo 
determinado mediante puntos finales recibe el nombre de interpolación. 

Defina las funciones 


х= х x — х0 
Lo(x) = E Y 110) = 
та 


i = X0 ` 
El polinomio de interpolación de Lagrange lineal a través de (xo, yo) у (x1, y1) es 


х= X 


Р(х) = Lo) f (хо) + L100)f (x1) = „ЛӨ. 


Xx = X1 
Р(х) + 
0 ХІ 


X 


xı — 
Observe que 

Го(х0) = 1, Lo@ı)=0, (о) =0, y Li&ı)=1, 
lo cual implica que 


Р(хо) = 1: (хо) +0: f(x1) = fo) = Yo 


Р(х) = 0: (хо) +1: РО) = f(x1) = у. 


Por Іо que Р es el único polinomio de grado a Іо más 1 que pasa рог (хо, yo) у (х1, y1). 


Determine el polinomio de interpolación de Lagrange que pasa por los puntos (2, 4) y (5, 1). 


Solución en este caso, tenemos 


me E dt Y 
oS E И Естан 
por Іо que 
PO) = 205) а 2) ах 20 12 =—х+6 
х= 3 3“ = а" 3 3* 37 X Е 


La gráfica de y = Р(х) se muestra en la figura 3.3. п 


3.1  Interpolación y el polinomio de Lagrange 81 


Figura 3.3 
Para generalizar el concepto de interpolación lineal, considere la construcción de un 
polinomio de grado n que pasa a través de n + 1 puntos 
(хо, Fo), (х1, Jœ) A (2,2, ДО)» 
(Véase la figura 3.4.) 
Figura 3.4 


En este caso, primero construimos, para cada k = 0, 1, ..., n, una función L, (x) con la 
propiedad de que £,,«(x;) = О cuando i Æ k y Ln i(xx) = 1. Para satisfacer Г, (xi) = 0 para 
cada і Æ К se requiere que el numerador de L, (x) contenga el término 


(х — xo) (e = x1) +++ (o — Хк—1)(Х — Xp 41) + Œ — Xn). 
Para satisfacer L, (xx) = 1, el denominador de £,,x(x) debe ser el mismo término, pero 
evaluado en x = ху. Por lo tanto, 


(х= X0) +++ (Хх — Xx 1 (A — M4 1) ++ (ŒX — Xn) 


Es = А 
ai (х» = x0) (р Ari Ak — Хт) +++ (к Ха) 


Un bosquejo de la gráfica de una £,, (cuando n es par) se muestra en la figura 3.5. 
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Figura 3.5 


Teorema 3.2 


La fórmula de interpolación 
nombrada por Joseph Louis 
Lagrange (1736-1813) 
probablemente era conocida 

por Newton alrededor de 1675, 
pero al parecer fue publicada por 
primera vez en 1779 por Edward 
Waring (1736-1798). Lagrange 
escribió mucho sobre el tema de 
interpolación y su trabajo tuvo 
una influencia significativa sobre 
los matemáticos posteriores. Él 
publicó este resultado en 1795. 


El símbolo ] [ se usa para escribir 
productos de manera compacta y 
es similar al símbolo 55 que se 
utiliza para escribir sumas. Por 
ejemplo 


3 
Пош = а * a2 жаз. 


Ejemplo 2 


= Interpolación y aproximación polinomial 


El polinomio de interpolación se describe fácilmente una vez que se conoce la forma 
Ln Este polinomio, llamado enésimo polinomio de interpolación de Lagrange, se define 
en el siguiente teorema. 


Si xo Ху, -.., Xn Son п + 1 números distintos y f es una función cuyos valores están determi- 
nados en estos números, entonces existe un único polinomio P(x) de grado a lo sumo n con 


f(x) = Р(х), paracadak=0,1,...,n. 
Este polinomio está determinado por 


Р(х) = Р (хо) Ел o (x) +. + Р(х) Ln n (a) = 5 Р(х) Ln kx), 


k=0 


(3.1) 


donde, para cadak=0,1,...,n, 
(x = хо)(х = X1) +++ (e — х—1)(® — Mp1) +++ (X — Xn) 
(хк — Хо) (Xk — X1) == (Хк — Хк—1)(Хк — Xk+1) 5 (Xk — Xn) 


Lax) = (3.2) 


Е П (х — xi) 
бк) ы 
¡Ak 


Escribiremos Ln (х) simplemente como L(x) cuando no haya confusión en cuanto a 
su grado. 


a) Use los números (llamados nodos) 


хо = 2, xı = 2.75 ух = 4 para encontrar el polinomio de interpolación de Lagrange 
de segundo grado para f(x) = 1/x. 


b) Use este polinomio para aproximar f(3) = 1/3. 


Solución a) Primero determinamos los coeficientes polinómicos у(х), L¡(x) y L2(x). Еп 
forma anidada, estos son 


(х – 2.75)(к 4) 2 


0) = —улзуз—ду = 56-279) — 4), 
roan E-D- a 
SA D 
y 
ya ОЕЕО. она), 


(4— 2)(4— 2.75) 5 


Figura 3.6 


Teorema 3.3 


Existen otras formas de expresar 
el término de error para el 
polinomio de Lagrange, pero 
ésta puede ser la forma más 

útil y la que concuerda más 
estrechamente con la forma de 
error del polinomio estándar 

de Taylor. 
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Además, f (xo) = /(2) = 1/2, f (х1) = $Q.75) =4/11, y 00) = f4) = 1/4, por lo 
que 


2 
Р(х) = У FL) 


k=0 


= La — 2.75)(х — 4) — a — 2)(х —4) + г (х — 2)(х – 2.75) 


1 235, 49 
272 88 44 


b) Una aproximación рага f (3) = 1/3 (véase la figura 3.6) es 


9 105 49 
3) Р(3) = 
fO) 6) 22 88 24 


29 
= Ат 0.32955. 
88 


Recuerde que en Іа sección de apertura de este capítulo (consulte la tabla 3.1), encontramos 
que ninguna expansión en polinomios de Taylor alrededor de xy = 1 se puede usar para 
aproximar razonablemente f(x) = 1/x en x = 3. a 


El siguiente paso es calcular un residuo o cota para el error involucrado en la aproxima- 
ción de una función mediante un polinomio de interpolación. 


Suponga xo, х1, ... , Xn son números distintos en el intervalo [a, b] y f € C "+![a, b]. Enton- 
ces, рага cada x en [a, b], existe un número £(x) (generalmente no conocido) entre mín (xo, 
Xi, <- Xn} y таӣх{хо хі, ..., Xn} y, por lo tanto, en (а, b), con 


(n+1) 
FO = Ро) + Ea) а)ба), 63) 


donde P(x) es el polinomio de interpolación determinado en la ecuación (3.1). 


Demostración Primero observe que si х = хк para cualquier k = 0, 1, ..., n, entonces f(xx) = 
Р(х) y al elegir £(xą)de manera arbitraria en (a, b) se obtiene la ecuación (3.3). 
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Six Æ xp, рага todas las k = 0, 1,... ‚п defina la función g para ten [a, b] mediante 


(t = x9)( — x1): “т (t = Xn) 
(х — хо)(х — x1) ++ (xX — Xn) 
"т @—х) 


= M0 = РО) 1100 РО) [| ———. 


y (Х — 2ч) 


80) =/@)—Р@)—[/(х)— Р(х)] 


Puesto que f є C"*![a, b], y P є C™[a, b], se sigue que g € С"+![а,Ь]. Para t = xx, 
tenemos 


n 


вод) = fE) — Pad- 170) – РО 22 =0 — [4 (0) — Р(х)]-0 =0. 


i=0 


Además, 


(х = х;) 
р) Р(х) —[f(x) – P(x)] = 0. 


(х – 


80) = Роа) – Р(х) —[/(х)— РО [| 
і=0 Ñ 

Por lo tanto, g € C"+Ha, bl, y g se anula en los п + 2 números distintos x, Хо, X1,... , Xp. 

Por el teorema generalizado de Rolle 1.10, existe un número ё en (a, b) para el que 

g+D (E) = 0.Por lo que, 


(1 +1) (п+1) (п+1) р gnt r (t — x;) 
0=8" DE) = FDE) -PDE -E-P | - (34) 
1=& 


п+1 —r: 
і e (x — xi) 


Sin embargo, P(x) es un polinomio de grado a lo sumo n, por lo que la derivada (n + 1), 
P+D (x), es cero. Además [| [0 — x:)/(x% — x;)] es un polinomio de grado (п + 1), por 
lo que 


n 


(t a Xi) 1 п+1 5, : 
П = 7 t”™ + (términos de menor grado en /), 
ico Mx) Шоб — x) 


а! r =k) (п + 1)! 
dirt! 2 —х) П (х = x) 


Ahora, la ecuación (3.4) se convierte en 


— pun @ +1! 
0= $ @—0—[/(х) БОЛГ бое] 
y, después de resolver f (x), tenemos 
7+0) ү 
Дх) = Р(х) + 1)! [ [o xi). a 


ї=0 


La fórmula de error еп el teorema 3.3 es un resultado teórico importante porque los 
polinomios de Lagrange se usan ampliamente para deducir la diferenciación numérica y 
los métodos de integración. Las cotas de error para estas técnicas se obtienen a partir de la 
fórmula del error de Lagrange. 

Observe que la forma del error para el polinomio de Lagrange es bastante similar a la 
del polinomio de Taylor. El enésimo polinomio de Taylor alrededor de xy concentra toda 
la información conocida en хо y tiene un término de error de la forma 


PAPER) 


a e 


Ejemplo 3 


Ejemplo 4 
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El polinomio de Lagrange de grado n utiliza información en los distintos números xo, х], 
. + +, Xn y, en lugar de (x — хо)" su fórmula de error utiliza el producto de los n + 1 términos 


(x — xo), (x —X1),... , (X — Xp): 


FOP EOD 
(n+1)! 


(х хо)(х х1) +: (Хх — Xp). 


En el ejemplo 2 encontramos el segundo polinomio de Lagrange para f(x) = 1/x en [2, 4] 
usando los nodos хо = 2, xı = 2.75 y x2 = 4. Determine la forma del error para este polinomio 
y el error máximo cuando el polinomio se usa para aproximar f(x) para x є [2,4]. 


Solución Сото f(x) = х!, tenemos 
FOS, f'E, y f0)=-6* 
En consecuencia, el segundo polinomio de Lagrange tiene el error de la forma 


PUE) 
3 


! 


(х— хо)(х— xE хә) = — EE 2.75)(х—4), рага &(х)еп(2, 4). 


El valor máximo de (£(x))7* en el intervalo es 27 = 1/16. Ahora necesitamos determinar el 
valor máximo en este intervalo del valor absoluto del polinomio 


35 , 49 


gŒ) = (х — 2)(х — 2.75)(х — 4) = x? — д^ + 2" 22. 


Сото 


35 49 35 49 1 
D, (+ — rad +. ie 22) = 3x? x+== z8x Dx — 7), 


los puntos críticos se presentan en 


7 7 25 T 7 9 
= —, con -| = —, = —, con —|р=——. 
Хх =з, Соп \з ] = тов “ШЕ ы; 16 
Por lo tanto, el error máximo es 
de 1 9 9 
PEN) (х — хо)(х = x1)(x — x2)] < | = zx 0.03515625. ш 


3! © 16| 16 256 


El siguiente ejemplo ilustra cómo se puede usar la fórmula del error para preparar una 
tabla de datos que garantizará un error de interpolación dentro de una cota establecida. 


Suponga que se va a preparar una tabla para la función f(x) = е", para х en [0, 1]. Imagine 
que el número de lugares decimales proporcionado por entrada es 4 > 8 y que Л, el tamaño 
del paso es la diferencia entre valores adyacentes x. ¿Qué tamaño de paso h garantizará que 
la interpolación lineal proporcione un error absoluto a lo máximo de 106 para todas las х 
en [0,1]? 


Solución Sean xo, xy, ... los números еп los que se evalúa f y x está en [0, 1] y suponga que j 
satisface ху = х = x;+1. La ecuación (3.3) implica que el error en la interpolación lineal es 


Po. 
(x 


70208) 
2! 2 


If = Р(х)| = xj) — xj+1)| = (œ= l = х1). 
Como el tamaño del paso es A, entonces x; = jh, хунт = (j + 1)h, y 


|/® (&)| 
2! 


50) – Рк) < Iœ — ЈА) — (7 + 1)Л)|. 
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Por lo tanto, 


MÁXgeJo,1] е 


A 
В 
КЕМ 
ы 


Аб) -= Р(х)| < [œ — ¡x= 7 + DA)! 


2 хрх ¿41 


ІЛ 


7. máx (E MA G + DH). 


2 xjSxX<x¡ 


Considere la función g(x) = (x— ¡hMx—(J+D)h),parajh < x < (¡+1)h. Luego 


h 
#@) = (к - 0 +1®)+— =2 (+ 1-3). 


el único punto crítico para g se encuentra en x = ¡h+h/2,con g(jh+h/2) = (Л/2)° 
= h?/4, 

Puesto que g(jh) = Оу g((¡ + 1)л) = 0, el valor máximo de |g'(x)| en [jh, (¡+ DA] 
se debe presentar en el punto crítico, lo cual implica que (véase el ejercicio 21) 


e e 

(х) – Р(х) < = máx |2(х)| < 5: — = 
If ЕЖЕ 1800155 
Por consiguiente, para garantizar que el error еп la interpolación lineal está acotado por 
1079, es suficiente elegir h de tal forma que 


eh? 26 2 А —3 
—— < 10”. Esto implica que h<l1.72x 10°. 


Puesto que n = (1 — 0)/h debe ser un entero, una selección razonable para el tamaño del 
paso es Л = 0.001. п 


La sección Conjunto de ejercicios 3.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


ж 3.2 Aproximación de datos y método de Neville 


En la sección anterior encontramos una representación explícita para los polinomios de La- 
grange y su error cuando se aproxima una función sobre un intervalo. El uso frecuente de 
estos polinomios implica la interpolación de datos tabulados. En este caso, una represen- 
tación explícita del polinomio podría no ser necesaria, sólo los valores del polinomio en 
puntos específicos. En esta situación, sería posible que la función subyacente a los datos no 
se conozca, por lo que la forma explícita del error no se puede usar. Ahora, ilustraremos una 
aplicación práctica de interpolación en dicha situación. 


Ilustración La tabla 3.2 lista los valores de una función f en diferentes puntos. Las aproximaciones para 
F(1.5) obtenidas con distintos polinomios de Lagrange que usan estos datos se comparará 
para probar y determinar la precisión de la aproximación. 


AE El polinomio lineal más apropiado usa xy = 1.3 y ху = 1.6 porque 1.5 se encuentra entre 1.3 
Ў FG) y 1.6. El valor del polinomio de interpolación en 1.5 es 
т о. pas) = LITIO зуф 02—19) „(е 
á В 101. = 3537 . FF RAR E 
16 0.4554022 (1.3 — 1.6) (1.6 — 1.3) 
19 0.2818186 _ (15—10) (0.6200860) + (1.5 — 1.3) (0.4554022) = 0.5102968 
2.2 0.1103623 = (1.3 — 1.6) ` (1.6 — 1.3) ` 77 и 


Definición 3.4 
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Es posible usar razonablemente dos polinomios de grado dos, uno con xy = 1.3, ху = 1.6 y 
хә = 1.9, lo cual nos da 


Рь(1.5) = (1.5 — 1.6)(1.5 — 1.9) (0.6200860) + (1.5 — 1.3)(1.5 — 1.9) (0.4554022) 
(1.3 — 1.6)(1.3 — 1.9) (1.6 — 1.3)(1.6 — 1.9) 


(1.5 — 1.3)(1.5 — 1.6) 
(1.9—1.3)(1.9— 1.6) 


(0.2818186) = 0.5112857, 


y uno con ху = 1.0, ху = 1.3 у x2 = 1.6, lo cual nos da Б,(1.5) = 0.5124715. 

En el caso de tercer grado, también hay dos opciones razonables para el polinomio, una 
con хо = 1.3, ху = 1.6, x2 = 1.9 y хз = 2.2, lo cual nos da Px(1.5) = 0.5118302. La segunda 
aproximación de tercer grado se obtiene con xy =1.0, ху = 1.3, x2 = 1.6 y x3 = 1.9, lo cual 
nos da Ё, (1.5) = 0.5118127. 

El polinomio de Lagrange de cuarto grado usa todas las entradas en la tabla. Con 
xo = 1.0, xı = 1.3, x, = 1.6, x3 = 1.9 y ха = 2.2, la aproximación es P4(1.5) = 0.5118200. 

Puesto que Px(1.5), Pz(1.5) y Pa(1.5) concuerdan con una exactitud de 2 X 107° unida- 
des, esperamos este grado de precisión para estas aproximaciones. También esperamos que 
Pa(1.5) sea la aproximación más precisa уа que usa la mayor parte de los datos proporcio- 
nados. 

La función que estamos aproximando es, en realidad, la función de Bessel de primera 
clase de orden cero, cuyo valor en 1.5 se conoce como 0.5118277. Por lo tanto, las verdade- 
ras precisiones de las aproximaciones son las siguientes: 


PL(1.5) – F(1.5)| ~ 1.53 х 107°, 
Р,(1:5) = f(1.5) 5.42 x 107%, 
Ё,(1.5) – (1.5) = 6.44 х 107°, 
Р,(1.5) – (1.5) ~ 2.5 х 1076, 
È (1.5) – f(1.5)| ~ 1.50 х 1075, 


Р,(1.5) – }(1.5)| 27.7 x 107%. 


Aunque Px(1.5) es la aproximación más precisa, si no conocemos el valor real de f(1.5), 
aceptaríamos P4(1.5) como la mejor aproximación ya que incluye la mayor cantidad de da- 
tos sobre la función. El término del error de Lagrange derivado del teorema 3.3 no se puede 
aplicar aquí porque no conocemos la cuarta derivada de f. Por desgracia, este casi siempre 
es el caso. п 


Método de Neville 


Una dificultad práctica con la interpolación de Lagrange es que el término del error es difícil 
de aplicar, por lo que el grado del polinomio que se necesita para la precisión deseada en 
general se desconoce hasta que se realizan los cálculos. Una práctica común es calcular los 
resultados dados a partir de diferentes polinomios hasta que se obtiene el acuerdo apropia- 
do, como se hizo en la ilustración anterior. Sin embargo, el trabajo efectuado al calcular la 
aproximación con el segundo polinomio no disminuye el trabajo necesario para calcular 
la tercera aproximación, ni la cuarta aproximación es fácil de obtener una vez que se conoce la 
tercera aproximación y así sucesivamente. Ahora, derivaremos estos polinomios de aproxi- 
mación de una manera que use los cálculos previos para una mayor ventaja. 


Sea funa función definida en хо, X1,X2,... , Xn y Suponga que mı, M2, ..., Mp SON k enteros 
diferentes, con O < m; < п para cada i. El polinomio de Lagrange que concuerda con f(x) 
en los puntos КОХ, Хто, » +» » Xm; Se denota Pp, >... m, ©). а 


CAPÍTULO 3 = Interpolación y aproximación polinomial 


Ejemplo 1 


Teorema 3.5 


Suponga que xo = 1, ху = 2, хә = 3, x3 = 4, x4 = 6 y f(x) = е“. Determine el polinomio de 
interpolación que se denota Р! 2 4(x) y use este polinomio para aproximar f(5). 


Solución Éste es el polinomio de Lagrange que concuerda con f(x) en ху = 2, 12 = 3 y 
x4 = 6. Por lo tanto, 


x—=3(x=6), (х- 2)(х-6) 3 (2x3) 5 


Pi 24x) = 2-3-6) (3—23 6)“ (6 2)(6 3) | 


por lo que, 


6-36-60, G6-26-60 3 6-265-3) 5 


О Р) =5 3020 +036) + 0672)(6—3)° 


1 1 
=- 404 уе ~ 218.105. m 


El siguiente resultado describe un método para generar de forma recursiva las aproxima- 
ciones del polinomio de Lagrange. 


Sea f definida en хо, x1, ..., Xg y sean x; y x; dos números distintos en este conjunto. Entonces 


(х= ху) Ро... жт, (0) — (e — xi) Po,1,...,i—1,i+1,... k) 


(х= xj) 


P(x) = 


es el k-ésimo polinomio de Lagrange que interpola f en los puntos k + 1 xo, хі, ..., Xk 


Demostración Рага la facilidad de la notación, sea Q = Po1....i-L:i+1....k Y Ò = Pot... 
¡-1,5+1,...k- Puesto que Q(x) y Ô (x) son polinomios de grado k — 1 o menos, Р(х) es de 
grado máximo К. 

Primero, observe que O(x;) = f(x;) implica que 


Р(х) = (х= xj) (xi) — (= xi) O (о) _ Ө 2 fa) = fta): 
j 


Xi— Xj (xi 


Similarmente, сото Q (xj) = f (xj), tenemos que P (x;) = бху). 
Además, si 0 < r < k y r no es i ni j, entonces O(x,) = О(х,) = Р(х). Por lo tanto, 


(y = 1) Or) — (к — х) 00) _ (6x3) 


P= Xi— Xj (х= xj) 


fœ) = fœ). 


Pero, por definición Po 1... «(x) es el único polinomio de grado máximo К que concuerda con 
f еп хо, хү,... , Xg. Por lo tanto P = Роу. к. п 


El teorema 3.5 implica que los polinomios de interpolación pueden generarse de manera 
recursiva. Por ejemplo, tenemos 


1 
Por == [х = xo) Pi + (x—x1)Pol, Pio = 
Хр — Xo X2 — ХІ 


1 
Боло = [(x —x0)P1 2 + (х — x2)Po 11, 
X2 — X0 


[(x — х)Р»› + (х = x2)P1], 


y así sucesivamente. Estos se generan de la manera que se muestra en la tabla 3.3, donde 
cada fila se completa antes de que las filas sucesivas comiencen. 


Tabla 3.3 


Eric Harold Neville (1889-1961) 
aportó esta modificación de 

la fórmula de Lagrange en un 
artículo publicado en 1932. [N] 


Tabla 3.4 


Ejemplo 2 


Tabla 3.5 


х Fx) 


1.0 0.7651977 
1.3 0.6200860 
1.6 0.4554022 
1:9 0.2818186 
2.2 0.1103623 
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Xo Po 

xı P; Po. 

х2 Р, Р,» Боо 

х3 Р» Рз Pros Po.1.2,3 

X4 P4 Р» Розд P123.4 Po.1.2.3.4 


El procedimiento que usa el resultado del teorema 3.5 para generar recursivamente las 
aproximaciones de polinomios de interpolación recibe el nombre de método de Neville. La 
notación P que se usa en la tabla 3.3 es pesada debido al número de subíndices que se utilizan 
para representar las entradas. Observe, sin embargo, que mientras se construye un arreglo, 
sólo se necesitan dos subíndices. El procedimiento hacia abajo en la tabla corresponde al 
uso consecutivo de los puntos x, con una і más grande, y el procedimiento hacia la derecha 
corresponde al incremento del grado del polinomio de interpolación. Puesto que los puntos 
aparecen de manera consecutiva en cada entrada, necesitamos describir sólo un punto de 
inicio y el número de puntos adicionales que se usan en la construcción de la aproximación. 

Para evitar los múltiples índices, dejamos que О; ;(х) para 0 < j < i, denote el polinomio 
de interpolación de grado j en los números (j + 1) х; ;, Xi-j41» +++ » Xi-1, Xi; es decir 


Оу = Рі раја. 


Usando esta notación obtenemos el arreglo de notación О en la tabla 3.4. 


xı Р, = Qio Po = Оз 

х2 Р, = Q20 Р,» = Q21 Роло = О22 

X3 P; = Озо Р›з = Оза Р, 2,3 = Q32 Po,1,2,3 = Озз 

Xa Р, = Одо Р = Q41 Рза = Оло Pi 2,3,4 = Q43 Po,1,2,3,4 = Ода 


Los valores de diferentes polinomios de interpolación en x = 1.5 se obtuvieron en la ilus- 
tración al inicio de esta sección usando los datos que se muestran en la tabla 3.5. Aplique el 
método de Neville a los datos mediante la construcción de una tabla recursiva de la forma 
que se observa en la tabla 3.4. 


Solución Sea xo = 1.0, xı = 1.3, x, = 1.6, хз = 1.9 y ха = 2.2, entonces Ооо = f(1.0), Ото 
= f(1.3), Озо = f(1.6), Озо = f(1.9) у Оло = 2.2). Estos son los cinco polinomios de grado 
cero (constantes) que aproximan f(1.5) y son iguales а los datos que se proporcionan en la 
tabla 3.5. 

Al calcular la aproximación de primer grado О| ¡ (1.5) obtenemos 


(х = хо) Ото — (х — х1) Ооо 


О11(1.5) = 
ХІ — Хо 
0.5 – 1.0)010 — (1.5 — 1.3)00. 
Е 1.3 = 1.0 
0.5(0.6200860) — 0.2(0.7651977 
= al А С КТ) = 0.5233449. 


De igual forma, 


(1.5 — 1.3)(0.4554022) — (1.5 — 1.6)(0.6200860) 
Q21 (1.5) = TE = 0.5102968, 


Q31 (1.5) = 0.5132634, y Q41(1.5) = 0.5104270. 


90 CAPÍTULO 3 = Interpolación y aproximación polinomial 


Tabla 3.6 
Ejemplo 3 
Tabla 3.7 
i Xi In х; 
0 2.0 0.6931 
1 2.2 0.7885 
2 2.3 0.8329 
Tabla 3.8 


Se espera que la mejor aproximación lineal sea О» | porque 1.5 se encuentra entre 
x = 1.3 yx = 1.6. 
De manera similar, las aproximaciones usando polinomios de grado superior están dadas por 


1.5 — 1.0)(0.5102968) — (1.5 — 1.6)(0.5233449 
02015) ч a X ) L 05124715, 


032(1.5) = 0.5112857, у 042(1.5) = 0.5137361. 


Las aproximaciones de grado superior se generan de una manera similar y se muestran 
en la tabla 3.6. п 


1.0 0.7651977 

1.3 0.6200860 0.5233449 

1.6 0.4554022 0.5102968 0.5124715 

1.9 0.2818186 0.5132634 0.5112857 0.5118127 

22 0.1103623 0.5104270 0.5137361 0.5118302 0.5118200 


Si la última aproximación O4 ¿no fue suficientemente precisa, sería posible seleccionar 
otro nodo х y añadir otra fila a la tabla: 


xs Oso Os1 Os2 Os3 Os4 05,5. 


Entonces Одд, O5 4 y Qs 5 podrían compararse para determinar la precisión posterior. 
La función en el ejemplo 2 es la función de Bessel de primera clase de orden cero, cuyo 
valor en 2.5 es —0.0483838, y la siguiente fila de aproximaciones para f(1.5) es 


2.5 —0.0483838 0.4807699 0.5301984 0.5119070 0.5118430 0.5118277. 
La última nueva entrada, 0.5118277, es correcta para siete lugares decimales. 


La tabla 3.7 lista los valores de f(x) = In x precisos para los lugares dados. Use el método 
de Neville y la aritmética de redondeo de cuatro dígitos para aproximar £(2.1) = In 2.1 al 
completar la tabla de Neville. 


Solución Puesto que x — xy = 0.1, x ху = —0.1 y x — x2 = —0.2, tenemos Ооо = 0.6931, 
Оо = 0.7885 y Озо = 0.8329, 


1 0.1482 


= 0.1)0.7885 — (—0.1)0.6931] = ——— = 0.7410 
Qi, 02 [(0.1) ( ) ] 02 


0.07441 
= 0.7441. 


Qi = ы [(—0.1)0.8329 — (—0.2)0.7885] = 


La aproximación final que podemos obtener a partir de estos datos es 


1 0.2276 
Q2, = = [(0.1)0.7441 — (-0.2)0.7410] = ——— = 0.7420. 
І 0.3 0.3 
Estos valores se muestran en la tabla 3.8. шп 
i Xi x— Xi Qio O: Ог 
0 20 0.1 0.6931 
1 2.2. —0.1 0.7885 0.7410 
2 23 —0.2 0.8329 0.7441 0.7420 
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En el ejemplo anterior, tenemos f(2.1) = In2.1 = 0.7419 para cuatro lugares decimales, 
por lo que el error absoluto es 


|F(2.1) — P,(2.1)| = [0.7419 — 0.7420| = 107*. 


Sin embargo, f'(x) = 1/x, Ё" (х) =—1/x?, y f(x) = 2/x*, por lo que la fórmula de error 
de Lagrange (3.3) en el teorema 3.3 nos da la cota del de error 


и “®-—%)@—з)@—х2) 


|70.) – Р0.1)| = | 


= 8.3 х 107°. 


1 0.002 
= lgan 610-020-02) < 30y 


Observe que el error real, 1074, excede la cota del error, 8.3 х 1075. Esta aparente con- 
tradicción es una consecuencia de los cálculos de dígitos finitos. Nosotros usamos la arit- 
mética de redondeo de cuatro dígitos, y la fórmula del error de Lagrange (3.3) supone la 
aritmética de dígitos infinitos. Esto causó que nuestros errores reales excedieran el cálculo 
de error teórico. 


e Recuerde: No puede esperar mayor precisión de la proporcionada por la aritmética. 
El algoritmo 3.1 construye por filas las entradas en el método de Neville. 
Interpolación iterada de Neville 


Para evaluar el polinomio de interpolación P en los diferentes números n + 1, xo, ..., Xn en 
el número x para la función f: 


ENTRADA números х, хо, X1, +... , Xn; Valores f (xo), F(x1),... , f (Xn) como la primera 
columna Ооо, O1.0,--- , Ono de O. 


SALIDA la tabla О con Р(х) = О„„. 


Paso 1 Parai=1,2,...,n 
paraj=1,2,...,1i 
(=) Ог) Di1 51 


Xi — Xi-¡ 


haga Q; j = 


Paso 2 SALIDA (Q); 
PARE. ш 


La sección Conjunto de ejercicios 3.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WN 3.3 Diferencias divididas 


La interpolación iterada se usó en la sección previa para generar sucesivamente aproxima- 
ciones polinomiales de grado superior en un punto específico. Los métodos de diferencia 
dividida que se presentan en esta sección se usan para generar sucesivamente los polinomios 
en sí mismos. 


Diferencias divididas 


Suponga que Р„(х) es el enésimo polinomio de interpolación que concuerda con la función f 
en los diferentes números xo, х), ..., х. A pesar de que este polinomio es único, existen re- 
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Como en muchas áreas, Isaac 
Newton es prominente en 

el estudio de ecuaciones de 
diferencia. Desarrolló fórmulas 
de interpolación desde 1675, 
usando su notación A en tablas 
de diferencias. Adoptó un 
enfoque muy general hacia las 
fórmulas de diferencias, por lo 
que los ejemplos explícitos que 
produjo, incluyendo las fórmulas 
de Lagrange, a menudo son 
conocidas con otros nombres. 


= Interpolación y aproximación polinomial 


presentaciones algebraicas que son útiles en ciertas situaciones. Las diferencias divididas de 
frespecto а xo, х], ..., Xn Se usan para expresar Р„(х) en la forma 


Р„(х) = а + а(х — хо) + а(х — хо)(х = Ху) +++ а(х = хо) (х = хот), (3.5) 


para constantes apropiadas ay, 41, ..., An. Para determinar la primera de estas constantes, ao, 
observe que si Р„(х) se escribe en la forma de la ecuación (3.5), entonces evaluando Р„(х) en 
хо queda sólo el término constante ag; es decir, 


ао = Р, (хо) == f (хо). 


Similarmente, cuando Р(х) se evalúa ер х], los únicos términos diferentes de cero en Іа 
evaluación de P,(x1) son los términos constante y lineal, 


F (0) +41 (1 = xo) = Р„(ху) = f(x); 
por lo que 


Ро) = / бо) 


X1 — Хо 


(3.6) 


Ahora presentaremos la notación de diferencias divididas, que se relaciona con la no- 
tación A? de Aitkens que se usó en la sección 2.5. La ceroésima diferencia dividida de la 
función f respecto а х, denotada f[x;], es simplemente el valor de f en x; 


Лх] = FG). 


Las diferencias divididas restantes se definen de manera recursiva; la primera diferencia 
dividida de f respecto a х; y xi+ı se denota f[x;, Xi+1] y se define como 


(3.7) 


Ах] Лха 


Рх, хем] = (3.8) 
Xi41 Хі 
La segunda diferencia dividida, f[x;, Xi+1, Xi+2], se define como 
Plis хо] f [xi Xi] 
Лх, Xi+1, Xi+2] = - a 
Хро Xi 
De igual forma, después de que las (k — 1) -ésimas diferencias divididas, 
Fixi, Xiti, хо... Mia dl Y Р, Xi+2, +++ > Хе Хк], 
se han determinado, la k-ésima diferencia dividida relativa а х;, Xi+1, Xi42) - +. > Xi+k es 
Хх, Xi42) охе] Рх, Mig) >> ыык] 

JU its Mio al = - ЕЕ - ` - (3.9) 


Xi4k Хі 
El proceso termina con la única enésima diferencia dividida, 


Jira .. 


cs Kal = Flo) Аз» 


Xn — X0 


. „Xil 
-> Xn] = . 


Fo: х1, +. 


Debido a la ecuación (3.6), podemos escribir ај = f[xo, х1], justo cuando ay se puede ex- 
presar como dy = f(xo) = f [xo]. Por lo tanto, el polinomio de interpolación en la ecuación 
(3.5) es 


Pr (x) = /[хо] + хо, Хх1](х — xo) + а(х — xo) (x — х1) 
q dE ay (x = хо)(х = xı) TES (x = Xn-1). 
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Como se puede esperar a partir de la evaluación de ay y ај, las constantes requeridas son 


ax = flxo, X1, х0, ..., Xk], 
рага cada k = 0, 1, ..., n. Por lo que P,,(x), se puede reescribir en una forma llamada dife- 
rencias divididas de Newton: 
Р(х) = Ро] + Y о, Х,... ха] — 0) +++ (Х — Ха). (3.10) 
k=1 
El valor de f[xo, хі, ..., xx] es independiente del orden de los números Xq, х], ..., хь COMO Se 


muestra en el ejercicio 23. 
La generación de las diferencias divididas se describe en la tabla 3.9. A partir de estos 
datos, también se pueden determinar dos cuartas y una quinta diferencia. 


Tabla 3.9 
Primeras Segundas Terceras 
x fœ) diferencias divididas diferencias divididas diferencias divididas 
“ и fixı] х0] 
А1 Ло] 
fixo, xı] = a 
xı fix] flxo, x1, 12] = Ахт, хә] — fixo, х1] 
X2 — хо 
Дх, хә] = ыл! Д[хо, x1, x2, хз] = Monn ==! 
x2 Fla] Уре, хо, х8] ДЇхә, хз] — Да, х2] 
ко хз —x1 
Хх, хз] = ———— —— Ms ——— ш їч x3] 
Хз хз] fs = Д[хз, x4] = /[х2, x3] 
х4 — X2 
flrs, xal] = пыл! Д[хә,Х^з‚ х4, х5] = Е Еца = 
X4 Flxa] flo, xa, = Аха, x5] — f[x3, x4] 
Х5 = X 
Аха, х5] = Les] — firal с 
| Е X5 — X4 
x5 flxs] 


Fórmula de las diferencias divididas de Newton 


Para obtener los coeficientes de las diferencias divididas del polinomio de interpolación P en 
los (п + 1) números distintos хо, xı, ..., Xn para la función f: 


ENTRADA los números хо, x1, ... , Xn; valoresf (хо), f (x1), -.- , f Œn) conforme 
Foo» Ёо, ... a Fno- 
SALIDA los números Foo, Fi.1,... , Fn,n donde 


n 1—1 
Pa (x) = Foo + Y Fi Пе = xj). (Fii is f[xo, x1, ... ,xi].) 
i=l j=0 
Paso 1 Parai=1,2,...,n 
Para J = 1,2,1 


Fijar Fica joa 


haga F; j = (Ер = Р-р ...,0]) 


Xi — Xi-j 
Paso 2 SALIDA (Foo, Fii, ... , Fan); 
PARE. ш 


La forma de la salida en el algoritmo 3.2 se puede modificar para producir todas las 
diferencias divididas, como se muestra en el ejemplo 1. 
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Ejemplo 1 

Tabla 3.10 

x fœ) 

1.0 0.7651977 

1.3 0.6200860 

1.6 0.4554022 

1.9 0.2818186 

2.2 0.1103623 
Tabla 3.11 
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Complete la tabla de diferencias divididas para los datos utilizados en el ejemplo 1 de la 
sección 3.2 y reproducidos en la tabla 3.10, y construya el polinomio de interpolación que 
usa todos estos datos. 


Solución La primera diferencia dividida relacionada con xp y xı es 


Flx1] = fixo] 0.6200860 — 0.7651977 
х= 1 1.3 — 1.0 


ДЇхо, х1] = = —0.4837057. 


Las restantes primeras diferencias divididas se calculan de la misma forma y se muestran en 
la cuarta columna en la tabla 3.11 


i Xi Лх] fixi- xi] Flo, 0-1, Xi] Flia, +. Xi] Ра] 
0 1.0 0.765 1977 


—0.4837057 
1 13 0.6200860 —0.1087339 
—0.5489460 0.0658784 
2 16 04554022 —0.0494433 0.0018251 
—0.5786120 0.0680685 
3 19 02818186 0.0118183 
—0.5715210 


4 22 0.1103623 


La segunda diferencia divida relacionada con xp, x1 у х2 es 


le e —0.5489460 — (—0.4837057 
A ы е ( ) L -0.1087339. 
X2 — X0 1.6 = 1.0 


Las restantes segundas diferencias divididas se muestran en la quinta columna de la tabla 
3.11. La tercera diferencia dividida relacionada con хо, х], х2 y хз y la cuarta diferencia divi- 
dida relacionada con todos los puntos de datos son, respectivamente, 


fx, хә, х3] — /[хо, x1, x2] —0.0494433 — (—0.1087339) 
Flxo, x1, x2, Хз] = - = 
Хз — Хо 1.9 — 1.0 


= 0.0658784, 


y 
fixi, хо, хз, ха] — f[xo, x1, хо, x3]  0.0680685 — 0.0658784 
Ха — Xo = 221.0 


J Uxo, х1, х2, 23, x4] = 
= 0.0018251. 


Todas las entradas se dan en la tabla 3.11. 
Los coeficientes de la forma de diferencias divididas hacia adelante de Newton del po- 
linomio interpolante se encuentran a lo largo de la diagonal en la tabla. Este polinomio es 


Pa(x) = 0.7651977 — 0.4837057(x — 1.0) — 0.1087339(x — 1.0)(х — 1.3) 
4 0.0658784(х — 1.0)(x — 1.3)(х — 1.6) 
4 0.0018251(х — 1.0)(x — 1.3)(х — 1.6)(х — 1.9). 


Observe que el valor P4(1.5) = 0.5118200 concuerda con el resultado en la tabla 3.6 para el 
ejemplo 2 de la sección 3.2, ya que los polinomios son los mismos. E] 
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El teorema de valor medio 1.8 aplicado a la ecuación (3.8) cuando i = 0, 


о) = оо) 


Хр — Хо 


fixo, х1] 


implica que cuando existe f’, f[xo, х1] = 7'(&) para algún número & entre хо у ху. El 
siguiente teorema generaliza este resultado. 


Teorema 3.6 Suponga que f e С"[а, Б] у xo, X1, ... , Xn son números distintos en [a, b]. Entonces existe 
un número ё en (a, b) con 


_ "ш. 


n! 


Flxo,x1,... ‚Хп 


Demostración Sea 


gx) = f(x) — Pníx). 


Puesto que f(x;) = Р„(х;) рага сада? = 0,1,... ,n, Іа función g tiene n + 1 ceros distin- 
tos en [a, b]. El teorema generalizado de Rolle 1.10 implica que existe un número £ en (a, b) 
соп g™ (&) = 0, por lo que 


0 = fE) - PPE. 
Puesto que P, (х) es un polinomio de grado n cuyo coeficiente principal es /[хо, X1,... , Xn], 
PRO) = 0 ео, 
para todos los valores de x. En consecuencia, 


(л) 
firo aii] 10. n 
n: 


La fórmula de las diferencias divididas de Newton se puede expresar en forma simplifi- 
cada cuando los nodos se ordenan de manera consecutiva con igual espaciado. En este caso, 
introducimos la notación h = х;у — х;,рага cada i = 0, 1,... ,n— 1 у ѕеах = xo + sh. 
Entonces la diferencia x — x;es x — x; = (s — i)h. Por lo que la ecuación (3.10) se convierte en 


Р(х) = Pa (xo + sh) = fixo] + shflxo, x1] + s(s — 1)4? f[xo, x1, хә] 
+- +s(s— 1) (s — n + Dh” Fixo, ху, ... Xp] 


= х0] + Y s(s — 1) (s — k + Л /[хо,х,... > Xg]. 
k=1 


Usando la notación de coeficiente binomial, 


5 5 (5 — 1)::-(5 = 6% 1) 
k) k! 


> 


podemos expresar P,, (x) de manera compacta como 


Pa (xx) = Pa (xo + sh) = /[хо] + 5 (Proa cl. (3.11) 


k=1 
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Definición 3.7 


Diferencias hacia adelante 


La fórmula de diferencias hacia adelante de Newton se construye al usar la notación de 
diferencias hacia adelante A que se presentó en el método A? de Aitken. Con esta notación, 


1 
als =. Ego) FG) = Af ao) 

ХІ = Хо h 

1 TA =A 1 
Ho, җ\, ж] = 35 A - aje ^S бо), 

y, en general, 
1 k 
Flo, х1, ..., х] = TA Fo). 


Puesto que /[хо] = f (xo), la ecuación (3.11) tiene la siguiente forma. 


Fórmula de diferencias hacia adelante de Newton 
2 $ 
Р, (х) = (о) + 2 e А“ f (xo) (3.12) 


Diferencias hacia atrás 


Si los nodos de interpolación se reordenan desde el último hasta el primero como 
Xn, Ха—1,... , Хо podemos escribir la fórmula de interpolación como 


Pal) = Рх] + Рх, Хп—1](Х = Xan) + Fla, Хп-1› Хп—2](Х = хһ)(х = Xn-1) 
+--+ Flxa, ... > хо](х Е Хп)(Х = Xn-1) кщ (% = xı). 


Si, además, los nodos tienen el mismo espaciado conx = х, +sh ух = x;+(s+n—i)h, 
entonces 


Pa (x) = Pala +sh) 
= fixa] + shflxn, X11] + 5(в + А2 Рх, Xn-1, хао] + 
+s(s +1) (s +n — Dh” f[xp,... xo]. 


Esto se usa para deducir una fórmula comúnmente aplicada conocida como fórmula 
de diferencias hacia atrás de Newton. Para analizar esta fórmula, necesitamos la siguiente 
definición. 


Dada la sucesión [pn) zp, defina la diferencia hacia atrás V p, (lea nabla р) con 
Ур, = рь = Pn-1, paran > 1. 
Las potencias superiores se definen de manera recursiva con 


Vi py = V(V"' py), parak > 2. m 
La definición 3.7 implica que 


е Y Gn), fondo tal = 51400) 


y, en general, 


VÉ f&n). 


ES E ET Хп ЕЕ 


Ilustración 


Tabla 3.12 
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Por consiguiente, 


s(s+1)---(s+n= 
A (5 +1)---( 
n! 


1 
Р(х) = fin] SVS Ent V? fan Don a). 


s(s +1) 
2 


Si extendemos la notación del coeficiente binomial para incluir todos los valores reales de s 
al tomar 
5 s(—s = 1)---(—s—k + 1) ( Т х= а дав, 
k) k! Б k! | 


entonces 


P œ) =/1х„1+(—1)! (5) VE)? (2) У О) 6-1)" („) vfa: 
Esto nos da el siguiente resultado. 


Fórmula de diferencias hacia adelante de Newton 


n 
Р(х) = лы+ HA ¿Jr (3.13) 
k=1 
La tabla 3.12 de diferencias divididas corresponde a los datos en el ejemplo 1. 
Primeras Segundas Terceras Cuartas 
diferencias diferencias diferencias diferencias 
divididas divididas divididas divididas 
1.0 0.7651977 
—0.4837057 
1.3 0.6200860 —0.1087339 
—0.5489460 0.0658784 
1.6 0.4554022 —0.0494433 0.0018251 
—0.5786120 0.0680685. 
1.9 0.2818186 0.0118183 
=0.5715210 


22 01103623 


Solamente un polinomio de interpolación de grado, a lo sumo, cuatro, usa estos cinco puntos 
de datos, pero nosotros organizaremos los nodos para obtener mejores aproximaciones de 
interpolación de grados uno, dos y tres. Esto nos dará un sentido de precisión para la aproxi- 
mación de cuarto grado para el valor dado de x. 

Si se requiere una aproximación para f(1.1), la opción razonable para los nodos sería xo 
=1.0,x, = 1.3, x2 = 1.6, хз = 1.9 y x4 = 2.2, puesto que esta opción usa lo antes posible 
los puntos de datos más cercanos a x = 1.1 y también usa la cuarta diferencia dividida. Esto 
implica que h = 0.3 y s = A por lo que la fórmula de diferencias dividas hacia adelante de 


Newton se utiliza con las diferencias divididas que tienen un subrayado sólido (___) en la 
tabla 3.12: 


1 
Pa(1.1) = Pa(1.04 50.3) 


1 1/2 
= 0.7651977 + 2 (0.3)(—0.4837057) + = (5) (0.3)? (-0.1087339) 


; 2 3 0.3)? (0.0658784 
(2) ( 5) озде») 
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James Stirling (1692-1770) 
publicó ésta y muchas otras 
fórmulas en Methodus 
Differentialis en 1720. En este 
trabajo se incluyen las técnicas 
para acelerar la convergencia de 
diferentes series. 


Tabla 3.13 


a e a E (0.3)*(0.0018251) 
sa) (=з) уе 


= 0.7196460. ы 


Para aproximar un valor cuando x está cerca del final de los valores tabulados, digamos, 
x = 2.0, de nuevo nos gustaría usar lo antes posible los puntos de datos con s = 2 y las 
diferencias divididas en la tabla 3.12 que tienen un subrayado ondulado ( ). Observe que 
la cuarta diferencia dividida se usa en ambas fórmulas: 


P4(2.0) = Pa (22 = 503) 


2 2/1 
= 0.1103623 — 5 (0.3)(—0.5715210) — = (5) 00.3)2(0.0118183) 


2 (10 (2 (озуго оввоввѕ) — 2 (2) (2) (2) о.з)“ 00.0018251 
ү (5) eros (5) (5) (5) estos 


= 0.2238754. 


Diferencias centradas 


Las fórmulas de diferencias hacia adelante y hacia atrás de Newton no son adecuadas para 
aproximar f(x) cuando x se encuentra cerca del centro de la tabla porque ninguna permitirá 
que la diferencia de orden superior tenga xy cerca de x. Existen varias fórmulas de diferen- 
cias divididas para este caso, cada una de las cuales incluye situaciones en las que se pueden 
usar para una máxima ventaja. Estos métodos reciben el nombre de fórmulas de diferencias 
centradas. Nosotros sólo consideraremos una fórmula de diferencias centradas, el método 
de Stirling. 

Para las fórmulas de diferencias centradas seleccionamos хо cerca del punto que se va a 
aproximar y etiquetamos los nodos directamente bajo хо como ху, х2, ... y aquellos directa- 
mente arriba como x-1, x-2, ... Con esta convención la fórmula de Stirling está dada por 


} 
Р„(х) = Pam (0) = Fixo] + S x х0] + flxo х1]) + 5282 flx1,x0,x11 (3.14) 
s(s? — 1)h3 
2 
+--+5*U5? — 1)(82 4) --- (52 — (т — DA” Fim -Xml 


s(s?—1 co. (52 — т?уд?"*! 
„Ж ) б ) 


Flx2, x-1, хо, Х1] + F[x-1, xo, x1, Х2]) 


С [== э, Ж] + Fm, ...> Xm+1)), 


sin = 2т + 1 es impar. Sin = 2m es par, usamos la misma fórmula pero borramos la última 
línea. Las entradas utilizadas para esta fórmula están subrayadas en la tabla 3.13. 


Primeras Segundas Terceras Cuartas 
diferencias diferencias diferencias diferencias 
х FO) divididas divididas divididas divididas 
хо fix] 
flix-2, x-1] 
х1 х1] ДЇх—2, x-1, Хо] 
ДЇх-1› х0] Р[х-2, Х—1, Xo, х1] 
Xo Лх] х1, хо, х] х2, х1, Хо, X1, X2] 
fixo, х1] /[х—1, хо, х1, хә] 
Xx] fix] Flxo, Х|, X2] 
flx, x2] 


х2 Ао] 
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Ejemplo 2 Considere la tabla de datos dada en los ejemplos anteriores. Use la fórmula de Stirling para 
aproximar f(1.5) con хо = 1.6. 


Tabla 3.14 


Cuando la palabra latina 
osculum, literalmente “boca 
pequeña” o “beso”, se aplica 

а una curva, indica que sólo la 
toca y tiene la misma forma. 

La interpolación de Hermite 
tiene esta propiedad osculante. 
Corresponde a una curva dada y 
su derivada obliga a que la curva 
de interpolación “bese” a la 
curva dada 


Solución Para aplicar la fórmula de Stirling, usamos las entradas subrayadas en la tabla de 


diferencias 3.14. 


Primeras Segundas Terceras Cuartas 
diferencias diferencias diferencias diferencias 
х Р(х) divididas divididas divididas divididas 
10 0.7651977 
—0.4837057 
13 0.6200860 —0.1087339 
—0.5489460 0.0658784 
1.6 0.4554022 —0.0494433 0.0018251 
—0.5786120 0.0680685 
1.9 0.2818186 0.0118183 
—0.5715210 
2.2 0.1103623 
La fórmula соп, Л = 0.3, хо = 1.6 y s = 3, se convierte en 
1 
FAS) ~ Pr | 1.6+ -3 (0.3) 
1 0.3 
= 0.4554022 + -3 > ((—0.5489460) + (—0.5786120)) 
1 2 
+ (-;) (0.3)? (-0.0494433) 
1 іє” А 
+ 5 3 1 | (0.3) (0.0658784 + 0.0680685) 
2 1 2 
+ | ) ( 5) ) (0.33*(0.0018251) = 0.5118200. ш 


Muchos textos sobre análisis numérico, escritos antes del uso generalizado de las compu- 
tadoras, incluyen amplios tratamientos de los métodos de diferencias divididas. Si se necesita 
un tratamiento más exhaustivo de este tema, el libro de Hildebrand [Hild] es una referencia 


especialmente buena. 


La sección Conjunto de ejercicios 3.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


AS | 3.4 Interpolación de Hermite 


Los polinomios osculantes generalizan tanto los polinomios de Taylor como los polinomios 


de Lagrange. Suponga que tenemos п + 1 números distintos xo, xı, 


no negativos то, M1, ... ,My, у т = máx[mo,m;,... 


..., Xn en [a, b] y enteros 
, Mn}. El polinomio osculante que 


aproxima una función f € C”la, b] еп x; para cada i = 0, ..., n, es el polinomio de grado 
mínimo que tiene los mismos valores que la función f y todas sus derivadas de orden menor 
que o igual que т; еп cada x;. El grado de este polinomio osculante es el máximo 


a 
¡=0 
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Definición 3.8 


Charles Hermite (1822— 

1901) realizó importantes 
descubrimientos matemáticos 

a lo largo de su vida en áreas 
como el análisis complejo y la 
teoría numérica, especialmente 
en relación con la teoría de las 
ecuaciones. Es, tal vez, mejor 
conocido por probar, en 1873, 
que e es trascendental; es decir, 
no es la solución para cualquier 
ecuación algebraica que tenga 
coeficientes enteros. Esto 
condujo, en 1882, a la prueba de 
Lindemann que establece que 
x también es trascendental, lo 
cual demostró que es imposible 
utilizar las herramientas de la 
geometría estándar de Euclides 
para construir un cuadrado que 
tenga la misma área que un 
círculo unitario. 


Teorema 3.9 


En 1878, Hermite dio una 
descripción de un polinomio 
osculante general en una carta 
para Carl W. Borchardt, a 
quien regularmente enviaba 
sus resultados nuevos. Su 
demostración es una aplicación 
interesante del uso de técnicas 
complejas de integración para 
resolver un problema de valor 
real. 


= Interpolación y aproximación polinomial 


Ya que el número de condiciones que se satisfacen es У ут; + (n + 1) у un polinomio 
de grado M tiene M + 1 coeficientes que se pueden usar para satisfacer estas condiciones. 


Sean xo, X1, ..., Xn п + 1 números distintos en [a, b] y para cada i = 0, 1, ..., n, sea m, un 
entero no negativo. Suponga que f є C”[a, b], donde m = тахо; <, т. 
El polinomio osculante que se aproxima a fes el polinomio P(x) de menor grado, tal que 


4*Р(х) dt f(x) 


к=0,1‚...,т. - 
ах“ ах" y ý 


, paracadai=0,1,...,n 


Observe que cuando п = 0, el polinomio osculante que se aproxima a f es el m,-ésimo 
polinomio de Taylor para f en xọ Cuando m; = 0 para cada i, el polinomio osculante es el 


enésimo polinomio de Lagrange que interpola f en xo, X1, ..., Xn- 
Polinomios de Hermite 
Cuando m; = 1, para cada = 0, 1, ..., n, nos da los polinomios de Hermite. Para una fun- 


ción f determinada, estos polinomios concuerdan con fen xo, хі, ..., Xn Además, puesto que 
sus primeras derivadas concuerdan con las de f, tienen la misma “forma” que la función en 
(x; ДО), en el sentido en el que las rectas tangentes al polinomio у la función concuerdan. 
Nosotros limitaremos nuestro estudio de los polinomios osculantes a esta situación y prime- 
ro consideraremos un teorema que describe de manera precisa la forma de los polinomios 
de Hermite. 


Si f € C![a, b] y xo,... 
concuerda con f y f’ en xo .. 
dado por 


, Xn € la, b] son distintos, el único polinomio de menor grado que 
„ Xn es el polinomio de Hermite de grado a lo sumo 2n + 1 


Нбх) = Y FEDH + DA, 30), 


j=0 j=0 


Donde cada L, ¡(x) denota el j-ésimo coeficiente del polinomio de Lagrange de grado n, y 
Нук) = [1—2(х —x PE), (2 (к) y jw) = a х0)12 (к). 
Además, sif e С2"+2[а, b], entonces 


(х = х0)2...(х = х,)? 


х) = Hon) + ud (Ey, 
Fx) 2n+1 (x) 0112) / (&(х)) 
para algunos (en general desconocidos) &(х) en el intervalo (a, b). п 
Demostración Primero, recuerde que 

0: sii , 

1.301) = и 7) 

1, 81 = Ј. 

Por lo tanto, cuando i Æ j, 
H, j&i) =0 у Êhj@)=0, 


Mientras que, para cada i, 


Hri) = [1 —2(х АС 8. y Ani (xi) = (х) 1 =0. 


Ejemplo 1 


Tabla 3.15 
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Por consiguiente, 


Ны) = Y FG) 04 fE 14 074) :0= fe), 


j=0 j=0 
JA 
de modo que Н, + concuerda con f en xo, X1, ... , Xn- 


Para mostrar la concordancia de Н), үү con f'en los nodos, primero observe que L, (х) 
es un factor de Н, ¿(x), por lo que H; j&i) = 0 cuando i 4 j Además, cuando і = j, tene- 
mos Lai (xi) = 1, por lo que 


Н! 


ni 


(х) = 21, ¿(x;) - L? Од) + ПП =2(% =%) Em ¿(00 12£5, (х1, Оң) 


ni ni 


= 21! 


ni 


E) +2L Ол) = 0. 


Рог lo tanto, Н, ; 


Finalmente, 


(хг) = О para todas las іу /. 


Н! 


ук) =D. ЕЛИС. 


n,j п,] 
= En, ¡Coi 1, j xi) F 2(x; = ху), œD], 


por lo que Йй Оч) =0sii #jy H (у) = 1. Al combinar estos hechos, tenemos 


Barr) = Уа) HAO a 04 О) 1= f(x). 


¡20 ¡20 
JA 
Por lo tanto, Нә» concuerda con f y Н), у con f’ en xo, X1,... , Xn- 


La unicidad de este polinomio y la deducción de la fórmula del error se consideran en 
el ejercicio 11. п 


Use el polinomio de Hermite que concuerda con los datos listados en la tabla 3.5 para encon- 
trar una aproximación de f(1.5). 


k Xk Ро) FO) 

0 1.3 0.6200860 —0.5220232 
1 1.6 0.4554022 —0.5698959 
2 1.9 0.2818186 —0.5811571 


Solución Primero calculamos los polinomios de Lagrange y sus derivadas. Esto nos da 


Р (x — х)(х — хә) 50, 175 $ 152 Lo) 100 175 
х) = = х ў x)= х ——; 
(xo = х1) (хо — x2) 9 9 9 20 9 9 
(х — хо)(х — хә) —100 , 320 247 ) —200 320 
2.1 (4) (xı = xo) (xı — х) 9 лк 9 И 9 м) 9 dd 9” 
y 
(x — хо)(х — xı) 50 , 145 А 104 LJ 100 145 
= =y xX Я х) = —x — —. 
22 (хә хоу(хә—х) 9 9 9 2 9 9 
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Los polinomios A) ;(х) y Êh, j(x) son entonces 


75 19 2 
a 


50, 1 
Њо(х) = П — 2(x — 1.3)(—5)] ( g“ 


e 50 2 175 152 a 
== ре 9 * 9 х 9 A 
Ho =1 (12,320, _ 247 ? 
Е a. 3. 3) 
ET И 50 , 145 10ү, 
2,21) = X 9° 9 X 9 r 
О TET 50, 175 152V? 
2005) = (х $ 0" 9 х 9 А 
tE 100 4 3220. 247ү? 
214) = (х Е 9 Хх 9 Ба 9 , 
y 
ГОТИ йы 50 , 145 10 
X) = (х Ў X X * 
а 9 9 9 
Finalmente, 


Н; (х) = 0.6200860 Н» o (x) + 0.4554022 ı (x) + 0.2818186H» 2 (x) 
— 0.5220232 Êh o (x) — 0.5698959 Ê} ı (x) — 0.5811571Ё# 2 (x) 


y 


4 64 5 
H; (1.5) = 0.6200860 | — | +0.4554022 [ = | +0.2818186 | — 
о O IRSA 


4 30 20 
— 0.5220232 | | — 0.5698959 (© | =0:5811571 ——— \ = 0.5118277, 
405 405 405 


un resultado que es apropiado para los lugares enumerados. ш 


A pesar de que el teorema 3.9 proporciona una descripción completa de los polinomios 
de Hermite, a partir del ejemplo 1 es claro que la necesidad de determinar y evaluar los poli- 
nomios de Lagrange y sus derivadas hace que el procedimientos sea tedioso para los valores 
pequeños de л. 


Polinomios de Hermite usando diferencias divididas 


Existe un método alterno para generar aproximaciones de Hermite que tiene sus bases en la 
fórmula de diferencias divididas de interpolación de Newton (3.10) en xo, хі, ..., Xn; esto es, 


Р(х) = fixo] У fixo, ios A = 20) ++ (e — хк). 


k=1 


El método alterno utiliza la conexión entre la enésima diferencia dividida y la enésima deri- 
vada de f, como se describe en el teorema 3.6 en la sección 3.3. 

Suponga que los diferentes números xo, xı, ..., Xn están dados junto con los valores de f 
y f' en estos números. Defina una nueva sucesión Zo, 21, ..., Z2n+1 Mediante 


Z2i = 02141 =, paracadai=0,1,...,n, 


Tabla 3.16 


Ejemplo 2 
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y construya la tabla de diferencias divididas en la forma de la tabla 3.9 que usa Zo, 21, ..., 
Z2n+1- 

Puesto que 22; = Z2i4+1 = X;¡para cada i, no podemos definir £[Z2;, Z2i+1] con la fórmu- 
la de diferencias divididas. Sin embargo, si suponemos, con base en el teorema 3.6, que la 
sustitución razonable en estas situaciones es /[22;, 2241] = f’ (Z2) = f'(%;), podemos usar 
las entradas 


Ое F En) 
en lugar de las primeras diferencias divididas no definidas 


fizo, 21], Рә, 13], ...>) Fn, Z2n+1]. 


Las diferencias divididas restantes se producen de la manera común y las diferencias dividi- 
das adecuadas se usan en la fórmula de diferencias divididas de interpolación de Newton. La 
tabla 3.16 muestra las entradas que se utilizan para las primeras tres columnas de diferencias 
divididas al determinar el polinomio de Hermite H5(x) para хо, xı у хо. Las entradas restantes 
se generan de la manera que se muestra en la tabla 3.9. El polinomio de Hermite está dado por 


2n+1 


Hon+1 (0) = flol + У feo- aE — zo) — 21) +0 (Х ze). 
k=1 


Una prueba de este hecho puede encontrarse en [Pow], p. 56 


Primeras diferencias Segundas diferencias 
FO divididas divididas 


Zo = Хо Дш] = / б) 


N 


fizo, 21] = Ј' (хо) 
Р, 22] — Ро, 21] 


е, Fizi] = Хб) Ро, z1, 22] = 
fiz- Fla] am 
Flr za] = =E 
С [22, 231 — (1, 22] 
z=% е Пааа T | a 
3541 
fE, 231 = (1) 
13 = X1 Flo] = / Ол) Fla 23, 24] = е = шыш 
4 — 22 
ЕЕ 
Е [za, 25] — Уз, 24] 
Za = 0 Ра] = fœ) Рз, 24, zs] = Ла, 25 3,24 


fE, zs] = f'(x2) 25 — Z3 
zs=x ЈЕ] = FG) 


Use los datos que se proporcionan en el ejemplo 1 y el método de diferencias divididas para 
determinar la aproximación polinomial de Hermite en x = 1.5. 


Solución Las entradas subrayadas en las primeras tres columnas de la tabla 3.17 son los 
datos que se proporcionaron en el ejemplo 1. Las entradas restantes en esta tabla se generan 
con la fórmula de diferencias divididas estándar (3.9). 

Por ejemplo, para la segunda entrada en la tercera columna usamos la segunda entrada 
1.3 en la segunda columna y la primera entrada 1.6 en esa columna para obtener 


.4554022 — 0.6200860 
2 T os чы = —0.5489460. 
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Tabla 3.17 


Para la primera entrada en la cuarta columna, usamos la primera entrada 1.3 en la tercera 
columna y la primera entrada 1.6 en esa columna para obtener 


—0.5489460 — (—0.5220232) 
1.6 – 1.3 


= —0.0897427. 


El valor del polinomio de Hermite en 1.5 es 


Н;(1.5) = f(13]+ /'(1.3)(1.5 – 1.3) + /[1.3, 1.3, 1.6](1.5 — 1.3) 

+ Д11.3, 1.3, 1.6, 1.6](1.5 — 1.3)2(1.5 — 1.6) 
+ fU.3, 1.3, 1.6, 1.6, 1.9](1.5 — 1.3)2(1.5 — 1.6)? 
+ Д11.3, 1.3, 1.6, 1.6, 1.9, 1.9](1.5 = 1.3)2(1.5 — 1.6)2(1.5 — 1.9) 

= 0.6200860 + (—0.5220232)(0.2) + (—0.0897427)(0.2)? 
+ 0.0663657(0.2)°(—0.1) + 0.0026663(0.2)°(—0.1)° 
+ (—0.0027738)(0.2)2(—0.1)2(—0.4) 

= 0.5118277. a 


1.3 0.6200860 


—0.5220232 
1.3 0.6200860 —0.0897427 
и —0.5489460 0.0663657 
16 04554022 —0.0698330 0.0026663 
и —0.5698959 0.0679655 —0.0027738 
16 04554022 —0.0290537 0.0010020 
=; —0.5786120 0.0685667 
1.9 02818186 —0.0084837 
и —0.5811571 


19 02818186 


La técnica que se usa en el algoritmo 3.3 se puede ampliar para su uso en la determina- 
ción de otros polinomios osculantes. Es posible encontrar un análisis conciso de los proce- 
dimientos en [Pow], pp. 53-57. 


interpolación de Hermite 


Para obtener los coeficientes del polinomio de interpolación de Hermite H(x) en los (n + 1) 
números distintos xo, ..., х para la función f: 


ENTRADA números xo, x1, +... , Xn; valores f (xo), ... , f&n) y Fo), .--, (а). 
SALIDA los números Ооо, Q1.1,... , Q2n+1,2n+1 donde 
H (x) = Qo + Q11 Œ — хо) + О (х — х0)? + Озз(х — x0) (a — x1) 
+ Одабх — xa — xa H 
+ Озан 2а+ (х — x0) (x — x1)? >> - (х — Xn-1) (x — ха). 
Paso 1 Рагаі = 0, 1,... ‚п haga los pasos 2 y 3. 


Paso 2 Haga zz; = х;; 


22141 = Xi; 
Озо = (х); 
Озо = f (xi); 


Ол = f(x). 
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Paso 3 Sii #0 entonces haga 


Озо = Qoi-10 
бл == 
Z2i = 421-1 
Paso 4 Parai=2,3,...,2n+1 
para j = 2, 3, ...> і haga Qi; = Qi ja _ Qi ja А 
Zi — Zi-j 
Paso 5 SALIDA (Ооо, Q1.1,++- + Озл+1ол+1); 
PARE. E 


3.5 Interpolación de spline cúbico’ 


Las secciones previas se preocuparon por la aproximación de las funciones arbitrarias en 
intervalos cerrados usando un polinomio individual. Sin embargo, los polinomios de orden 
superior pueden oscilar erráticamente; es decir, una fluctuación menor sobre una pequeña 
parte del intervalo puede inducir fluctuaciones grandes sobre todo el rango. Observaremos 
un buen ejemplo de esto en la figura 3.14 al final de esta sección. 

Un enfoque alternativo es dividir el intervalo de aproximación en un conjunto de subin- 
tervalos y construir (en general) un polinomio de aproximación diferente en cada subinter- 
valo. Esto se llama aproximación polinomial por tramos. 


Aproximación de polinomio por tramos 


La aproximación polinomial por tramos más simple es la interpolación lineal por tramos, la 
cual consiste en unir un conjunto de puntos de datos 


(Oi Р(хо)), (х1, Р(1)),..., On, /(®))} 


mediante una serie de líneas rectas, como se muestra en la figura 3.7. 


Figura 3.7 


Una desventaja de la aproximación mediante funciones lineales es que probablemen- 
te no existe diferenciabilidad en los extremos de los subintervalos, lo que, en un contexto 


¡Las pruebas de los teoremas en esta sección dependen de los resultados en el capítulo 6. 
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Isaac Jacob Schoenberg (1903— 
1990) desarrolló su trabajo 

sobre splines durante la Segunda 
Guerra Mundial mientras estaba 
de licencia en la Universidad de 
Pennsylvania para trabajar en 

el Army’s Ballistic Research 
Laboratory (Laboratorio de 
Investigación de Balística del 
Ejército) en Aberdeen, Maryland. 
Su trabajo original implicaba 
procedimientos numéricos 

para resolver ecuaciones 
diferenciales. La aplicación 
mucho más amplia de los splines 
en las áreas de ajuste de datos 

y diseño de geometría asistida 
por computador se volvieron 
evidentes con la disponibilidad 
generalizada de las computadoras 
en la década de 1960. 


La raíz de la palabra “spline” 

es la misma que la de “splint”. 
Originalmente, era una tira 
pequeña de madera que se puede 
utilizar para unir dos tablas. Más 
adelante, la palabra se usó para 
dibujar curvas suaves y continuas 
al forzar que la tira pasara a 
través de puntos específicos y 
siguiera a lo largo de la curva. 


Figura 3.8 
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geométrico, significa que la función de interpolación no es “suave”. A menudo es claro, 
a partir de las condiciones físicas, que se requiere suavidad, por lo que la función de aproxi- 
mación debe ser continuamente diferenciable. 

Un procedimiento alterno es usar un polinomio por tramos de tipo Hermite. Por 
ejemplo, si se conocen los valores de f y de f’ en cada uno de los puntos xy < ху < ... 
< хь se puede usar un polinomio cúbico de Hermite en cada uno de los subintervalos 
[хо, x1]; [x1, Х2],... , [Xp-1, Xn] para obtener una función que tiene una derivada continua 
en un intervalo [хо, Xn]. 

Determinar el polinomio cúbico de Hermite adecuado en un intervalo dado es simple- 
mente cuestión de calcular Нз(х) para ese intervalo. Los polinomios de interpolación de 
Lagrange necesarios para determinar H3, son de primer grado, por lo que esto se puede lograr 
sin mayor dificultad. Sin embargo, para usar los polinomios por tramos de Hermite para la 
interpolación general, necesitamos conocer la derivada de la función que se va a aproximar 
y esto con frecuencia no está disponible. 

El resto de esta sección considera que la aproximación usa polinomios por tramos que 
no requieren información específica sobre la derivada excepto, tal vez, en los extremos del 
intervalo en el que la función se aproxima. 

El tipo más simple de función polinomial por tramos diferenciable en un intervalo com- 
pleto [xo, х1] es la función obtenida al ajustar un polinomio cuadrático entre cada par su- 
cesivo de nodos. Esto se hace al construir una cuadrática en [хо х1] que concuerda con la 
función en ху y xı, Otra cuadrática en [x,, x2] que concuerda con la función en xı у x2, y así 
sucesivamente. Un polinomio cuadrático general tiene tres constantes arbitrarias: el término 
constante, el coeficiente de x y el coeficiente de x°, y sólo se requieren dos condiciones para 
ajustar los datos en los extremos de cada subintervalo. Por lo tanto, existe flexibilidad que 
permite seleccionar las cuadráticas de tal forma que el interpolante tenga una derivada conti- 
nua en [xo, xn]. La dificultad surge porque generalmente necesitamos especificar condiciones 
sobre la derivada del interpolante en los extremos xo y Xn. No hay un número suficiente de 
constantes para garantizar que las condiciones se satisfagan (consulte el ejercicio 34). 


Splines cúbicos 


La aproximación polinomial por tramos más común usa polinomios cúbicos entre cada par 
sucesivo de nodos y recibe el nombre de interpolación de spline cúbico. Un polinomio 
cúbico general implica cuatro constantes, por lo que existe suficiente flexibilidad en el proce- 
dimiento de spline cúbico para garantizar que el interpolante no sólo es continuamente dife- 
renciable en el intervalo, sino también tiene una segunda derivada continua. Sin embargo, la 
construcción del spline cúbico no supone que las derivadas del interpolante concuerdan con 
las de la función en su aproximación, incluso en los nodos (consulte la figura 3.8.) 


S¡Qj+1) = fæ) = Sjj) 


5/01) = Si10+1) 
(01) = 510) 


Definición 3.10 


Un spline natural no tiene 
condiciones impuestas para la 
dirección en sus extremos, por 
lo que la curva toma la forma de 
una línea recta después de pasar 
por los puntos de interpolación 
más cercanos a sus extremos. 
El nombre deriva del hecho de 
que ésta es la forma natural que 
asume una tira flexible, si es 
forzada a pasar por los puntos 
de interpolación específicos 

sin restricciones adicionales 
(consulte la figura 3.9.) 


Figura 3.9 


Ejemplo 1 
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Dada una función f definida en [a, b] y un conjunto de nodos a = хо < ху < -+> < Xp = b, 
un interpolante de spline cúbico S para fes una función que satisface las siguientes condi- 
ciones: 


a) S(x) es un polinomio cúbico, que se denota S;(x), en el subintervalo [x;, x¡+1] para 
cada j = 0,1,...,n — 1; 

b) 60) = Jys GE) = Jx) para cada j =0,1,...,n—1; 

с) 551031) = Sj@j+1) para cada j = 0, 1,...,п — 2; (implícito en b).) 

d) 51001) = 5 (хут) para cada j = 0, 1,...,п — 2; 

е) 57 (хы) = $7(ху) para cada j = 0,1,...,п — 2; 


f) Опо de los siguientes conjuntos de condiciones de frontera se satisface: 


i) S" (хо) = S” (х) = 0 (frontera natural) (o libre); 
i) 5(х0) = (х0) y SAn) = Р(х) 


(frontera condicionada). 


Aunque los splines cúbicos se definen con otras condiciones de frontera, las condiciones 
dadas en la parte f) son suficientes para nuestros propósitos. Cuando se presentan condicio- 
nes de frontera libres, el spline recibe el nombre de spline natural y su gráfica se aproxima 
a la forma que una varilla flexible y larga asumiría si fuera forzada a pasar por los puntos de 
datos {(хо, Р (хо), (х1, FED) +++, (хл, SEn) 

En general, las condiciones de frontera condicionada conducen a aproximaciones más 
precisas porque incluyen más información sobre la función. Sin embargo, para mantener 
este tipo de condición de frontera, es necesario tener, ya sea los valores de la derivada en los 
extremos o una aproximación precisa para esos valores. 


Construya un spline cúbico natural que pase por los puntos (1, 2), (2, 3) y (3, 5). 


Solución Este spline consiste en dos cúbicos. El primero para el intervalo [1, 2], que se 
denota 


So(x) = a + bo(x — 1) + со(х — 1? + ф(х — 17, 
y el otro para [2, 3], que se denota 
S) = ау + bi(x — 2) + c1(x — 2? + di (х — 2). 


Existen ocho constantes que se van a determinar y esto requiere ocho condiciones. Cuatro 
condiciones a partir del hecho de que los splines deben concordar con los datos en los nodos. 
Por lo tanto, 


2= }(1) = а, 3= f(2) = ао + bo + co + do, 
5= f6)=a +bi +c +d. 


3= }(2) = а, y 


Dos más provienen del hecho de que (2) = 5/(2) у 5(2) = 51 (2). Estos son 


502) =S: bo+20+3d=b y K=): 26 +64 = 201. 


Los dos finales provienen de las condiciones de frontera natural: 


570) =0: 20=0 y  S/G)=0: 20 +620 =0. 


Al resolver este sistema de ecuaciones obtenemos el spline 


S(x) = | 


2+ (х= 1) + 1(х – 1)?, рагах € [1,2] 
3+ 305—2) + 2(х – 2)? – ¿(+ — 2), ратах є [2,3]. и 
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Sujetar un spline indica que los 
extremos de la tira flexible están 
fijos de tal forma que cada uno de 
sus extremos es forzado a tomar 
una dirección específica. Esto es 
importante, por ejemplo, cuando 
los extremos de dos funciones 
spline deben concordar. Esto se 
realiza de manera matemática 

al especificar los valores de 

la derivada de la curva en los 
extremos del spline. 
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Construcción de un spline cúbico 


Como lo demuestra el ejemplo previo, un spline definido en un intervalo que se ha dividido 
en n subintervalos requerirá determinar 4n constantes. Para construir el spline cúbico que se 
interpola para una función dada f, las condiciones en la definición se aplican a los polinomios 
cúbicos 


530) =4;¡+bj(x— ху) +0c;(x xx +d- xj’, 


para cada j = 0, 1, ..., n — 1. Puesto que S;(x;) = а; = f (ху), la condición с) se puede aplicar 
para obtener 


aja = 5б) = Sj) = aj + bj Aja — Ху) H ej х0) бр х3), 


рага cada j = 0, 1, ... n — 2. 
Como los términos x;+1 — xjson usados repetidamente en este desarrollo, es conve- 
niente introducir una notación más simple 


Aj=X 41 х}, 


para cada j = 0, 1,...,n — 1. Si también definimos a, = f(x), entonces la ecuación 

аы =aj+bjhj+cjh} а) (3.15) 
se mantiene рага cada j = 0, 1, ..., п — 1. 

De manera similar, defina b, = S'(x,) y observe que 
Si(x) =b,+2cj(x — ху) + 3d,(x — х)? 
implica que S% (х ;) = bj, para cada j = 0, 1, ...,n — 1. Al aplicar la condición en la parte 
d) obtenemos 
Бы = Б; +2c;jhj +3d;h?, (3.16) 


para cada j = 0, 1, ..., n — 1. 
Otra relación entre los coeficientes de 5; se obtiene al definir с, = 5"(х,)/2 y aplicar la 
condición en la parte e). Entonces, para cada = 0, 1, ..., п — 1, 
ел =Cj+3djhj. (3.17) 


Resolviendo para d; en la ecuación (3.17) y sustituyendo este valor en las ecuaciones 


(3.15) y (3.16) obtenemos, para cada = 0, 1, ..., n — 1, las nuevas ecuaciones 
2 
аы =a; + bjhj + 0) + cjn) (3.18) 
y 
Раа =b;+hjy(c;+Cj41). (3.19) 


La relación final que involucra los coeficientes se obtiene al resolver la ecuación adecua- 
da en la forma de la ecuación (3.18), primero para b;, 


1 
h 


h; 
Бу = (aja а) — 0с; + cj), (3.20) 


J 
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y entonces, con una reducción del índice, para Б; |. Esto nos da 


bj = 


hj-1 
(aj = aj-1) E cj- + cj). 


Al sustituir estos valores en la ecuación obtenida de la ecuación (3.19), con el índice reduci- 
do en uno, obtenemos el sistema lineal de ecuaciones 


А 163-1 + 2(А j-1 +h jej + № усул = -(а}+1 aj) (a dj=1), (3.21) 


h hja 


Para cada j = 1, 2, ..., n — 1. Este sistema sólo tiene los {с} como incógnitas. Los valores 
de {л} y {а}}%_ están dados, respectivamente, por el espaciado de los nodos {ху} оу 


los valores de fen los nodos. Por lo que, una vez que se determinan los valores de {су}, es 


sencillo encontrar el resto de las constantes {b a a partir de la ecuación (3.20) y {d э] а 


partir de la ecuación (3.17). Entonces podemos construir los polinomios cúbicos {5 ¡(x) р: 


La pregunta más importante que surge en relación con esta construcción es si los valores 
de {c ;)'¡-y se pueden encontrar usando el sistema de ecuaciones dado en la ecuación (3.21) y, 
en este caso, si estos valores son únicos. Los siguientes teoremas indican que éste es el caso 
cuando se impone cualquiera de las condiciones de frontera dadas en la parte Ё) de la defini- 
ción. Las demostraciones de estos teoremas requieren material a partir del álgebra lineal, la 
cual se analiza en el capítulo 6. 


Splines naturales 


Si f se define ena = хо < х < ++: < Xn = b, entonces f tiene un spline natural único 
que interpola S en los nodos xo, X1, ..., Xn; es decir, un spline interpolante que satisface las 
condiciones de frontera natural S” (а) = 0 y S” (b) = 0. 


Demostración Las condiciones de frontera en este caso implican que с, = S” (х,)/2 = 0 
y que 


0 = S” (x0) = 2co + 6do (xo — хо), 


por lo que со = 0. Las dos ecuaciones cy = Оу с, = 0 junto con las ecuaciones en (3.21) 
producen un sistema lineal descrito por la ecuación matriz-vector AX = b, donde A es la 
matriz (n + 1) X (n + 1) 


1 0 ШОЧ 0 
ho 200 +1) А 
0. А. Xu +h) №. 
| | 5. 


: п Тү. “те 
ОУУ К С dit 0 1 
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y b y x son los vectores 


0 
3 3 

5 (02 — 41) — (а — ао) со 
СІ 
b= y х= |. 
3 3 : 
Tni (an — An-1) — 5 (9-1 — 4-2) с, 

0 


La matriz A es estrictamente dominante de manera diagonal; es decir, en cada fila, la 
magnitud de la entrada diagonal excede la suma de las magnitudes de todas las otras entradas 
en la fila. Un sistema lineal con una matriz de esta forma se mostrará mediante el teorema 
6.21 en la sección 6.6 para tener una única solución para co, C],... , Cn- п 


La solución para el problema del spline cúbico con las condiciones de frontera S” (xo) = 
S” (xn) = 0 se puede obtener al aplicar el algoritmo 3.4. 


Spline cúbico natural 


Para construir el spline cúbico interpolante S para la función f, definido en los números 
Xo < Xx] < -+> < Xn, que satisfacen S” (xo) = $”(х„) = 0: 


ENTRADA n; xo, X1; -.- , Xn; do = f (xo), а = f(%1),... , an = f (Xn). 


SALIDA aj,bj,cj,dj para j =0,1,...,n— 1. 
(Nota: S(x) =Sj(x) = а}+Ьу(х = ху) + cj(a х)? а(х — ху) para xj <x < xj.) 


Paso 1 Parai = 0, 1,..., п — 1 hagah; = х; — Xi. 


Paso 2 Parai = 1, 2,...,п — 1 haga 


3 3 
as = —(ai+1 а) — — (ai а). 
i ги 1+1 ) ma i 1) 
Paso 3 Determine lọ = 1; (Los pasos 3, 4 y 5 y parte del paso 6 resuelven un sistema 
lineal tridiagonal con un método descrito en el algoritmo 6.7.) 
ш = 0; 
Zo = 0. 
Paso 4 Parai=1,2,...,n—1 
haga l; =2(Xi41 — Xi-1) — hi-1Mi-15 
ш = hi/ li; 
zi = (0 — hj-12i1)/ li. 


Paso 5 Haga l, = 1; 
Zn = 0; 
ër =0; 


Paso 6 Рага ¡=n—1,n-2,...,0 
haga су = 2 — M jC j+; 
b; = (ар = а)/ ћу = h;(cj+1 +2c;)/3; 
dj = (суы — су)/ (ЗР). 
Paso 7 SALIDA (а;, Б, с;, а; рага j = 0, 1,...,п — 1); 
PARE. 
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Ejemplo 2  Alinicio del capítulo 3, proporcionamos algunos polinomios de Taylor para aproximar la ex- 
ponencial f(x) = e”. Use los puntos (0, 1), (1, e), (2, е?), у (3, е?) рага formar un spline 
natural S(x) que se aproxima a f(x) = e”. 


Solución Tenemos п = 3, họ = hı = hn = 1, а) = 1, ај = e, a = e, y аз = e”. Por lo 
que, la matriz A y los vectores b y x determinados en el teorema 3.11 tienen las formas 


1000 0 со 
пато 30е 2е+1) le 
а= ч жоу =ч E T е 
0001 0 сз 


La ecuación matriz-vector Ах = b es equivalente al sistema de ecuaciones 
Co = 0, 
со + 4c1 + с) =3(e* – 2e +1), 
с +40 +03 = 3(е? — 2e* + е), 
сз = 0. 


Este sistema tiene la solución со = сз = 0, y para cinco lugares decimales, 
1 1 
с = Се + 6e? — 9e +4) 2 0.75685, y со = Че — 9e? + бе — 1) ~ 5.83007. 


Al resolver para las constantes restantes obtenemos 


bo = (ar — а) — “©(с\ +200) 
н" ао з ©! со 


1 
= (6-1) – е + бе? — 9e + 4) ~ 1.46600, 
йа {ъ= = Чач] 
= — (а -— q = —AC С 
1 hi 2 1 3 2 1 


1 
= (e? — e) — pes +30? — 12e + 7) ~ 2.22285, 


A а Жү 
2= y a z (93 + 202 


= (е? — e?) (8e? — 18e? + 12e — 2) ~ 8.80977, 


1 1 
do = — (cı — co) = —(—е? + бе? — 9e + 4) ~ 0.25228, 
3ho 15 
1 la 2 
di = (о = с) = (e? — 3e? + Зе — 1) ~ 1.69107, 
3h; 3 
y 
d 7 ) E эё 6e +1) 1.94336 
= E С = er e = DE Z =]. El 
а 
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El spline cúbico natural se describe por tramos mediante 


1 + 1.46600х +0.25228x3, рага х є [0, 1], 
$(х) = 4 2.71828 + 2.22285(x—1) + 0.75685(x—1)? + 1.69107(x—1)%, рагах є [1,2], 
7.38906 + 8.80977(x—2) + 5.83007(x—2)? — 1.94336(x—2)3, рагах є [2,3]. 


aisr 


El spline y f(x) = е" se muestran en la figura 3.10. a 


Figura 3.10 


Una vez que hemos determinado un spline para una aproximación de una función, pode- 
mos usarlo para aproximar otras propiedades de la función. La siguiente ilustración implica 
la integral del spline que encontramos en el ejemplo previo. 


Ilustración Para aproximar la integral de f(x) = е" en [0, 3], que tiene el valor 


3 


/ ех dx = е — 1 ~ 20.08553692 — 1 = 19.08553692, 
0 


podemos integrar por tramos el spline que aproxima f en este intervalo. Esto nos da 


3 1 
/ $(х) = / 1 + 1.46600x + 0.25228х° dx 
0 0 
"2 
+ | 2.71828 + 2.22285(х — 1) + 0.75685(х — 1)? + 1.69107(x — 1)? dx 
1 


3 
dE f 7.38906 + 8.80977 (x — 2) + 5.83007 (x — 2)? — 1.94336(x — 2) dx. 
2 
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Integrando y calculando los valores de las potencias obtenemos 


1 


3 х2 х“ 
/ S(x)=|x + 1.46600— + 0.25228— 
o 2 4 1, 


(х—1)? (х—1)? cv 
+ |2.71828(x—1) + AL > +0:73685=——— + Кыш касы 
1 


+ 


(1-2)? (х—2)3 E 
7.38906(x—2) + 8.80977 5 + 5.83007 3 — 1.94336 1 
2 


1 
= (1 + 2.71828 + 7.38906) + 5 (1.46600 + 2.22285 + 8.80977) 


1 1 
+ 3 (0.75685 + 5.83007) + 4 (0.25228 + 1.69107 — 1.94336) 


= 19.55229. 


Puesto que los nodos están espaciados de manera equivalente en este ejemplo, la aproxima- 
ción de la integral es simplemente 


3 1 1 1 
I S(x) dx = (ao +aı +42) + z Čo ++) +z (co tci + с) + (o +а +d). 
0 


(3.22) 
n 


Splines condicionados 


Ejemplo 3 En el ejemplo 1 encontramos un spline natural 5 que pasa por los puntos (1, 2), (2, 3) y (3, 5). 
Construir un spline condicionado s que pase por esos puntos y que cumpla 5'(1) = 2 y 
5 (3) = 1. 


Solución Si 
so(x) = ао + bo(x — 1) + со(х — 1)? + dG — 1) 
es el cúbico en [1, 2] y el cúbico en [2, 3] es 


51(х) = аз + bi(x — 2) + сх — 2)? + (х — 2)Ў. 


Entonces, la mayoría de las condiciones para determinar ocho constantes son iguales a las 
del ejemplo 1. Es decir, 


2= }(1) = а, 3 = }(2) = а + +с +4, 3 = }(2) = а, y 
5= f(3)=a +b +с +d. 


50) = si (2): bo+2co+3d=b; y 800) = 57 (0): 2c + 6d = 2c 
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Teorema 3.12 


Sin embargo, las condiciones de frontera ahora son 
50) =2: bo=2 y (3) =1: bi+2cı+3d =1. 


Resolviendo este sistema de ecuaciones obtenemos el spline como 


| 2+2(x = 1) – 2 (х = 1) + 3 (х — 1), рагах є [1,2] 
s(x) = : п 


3+3(x — 2) + 2(х — 2)? — ¿(x—2)*, рагах € [2,3] 


En el caso general de las condiciones de frontera condicionada, tenemos un resultado que 
es similar al teorema para las condiciones de frontera natural descritas en el teorema 3.11. 


Si f se define en a = xo < xı < -++ < Xn = b y es diferenciable en a y b, entonces f tie- 
ne un único spline interpolante 5 condicionado en los nodos xo, Х1,... , Xn, es decir, un 
spline interpolante que satisface las condiciones de frontera condicionada S'(a) = f'(a) y 


S'(b) = f'(b). 


Demostración Puesto que f'(a) = S'(a) = S'(xọ) = bo, la ecuación (3.20) con j = O impli- 
ca que 


, 1 ho 
f (а) = —(a, — а) – (co + с). 
ho 3 
Por consiguiente, 
3 Р 
2hoco + Восі = ү! = a) — 3 f (а). 
0 


De igual forma, 
/'Ф) = bn = Dr-1 F һһ—1(Сл—1 F Cn), 


por lo que la ecuación (3.20) con j = n — 1 implica que 


/ An — аһ-1 An-1 
7 (Б) = (261-1 + Сп) + An-1(Cn-1 + Са) 
ћа-1 3 
аһ = an-ı m hei J 2 ) 
= Cn— Cn), 
hai 3 | 
y 
Ap-1Cp=1 + 21,16 = 3 f'(b) =? 3 (an — ал-1). 
п—1 


Las ecuaciones (3.21) junto con las ecuaciones 


3 
2hoCo + hoc; = m” = ао) — 3 f'(a) 


EE E + 2h,-1Cn = 3 f'(b) == (An == аһ—1) 


ћа-1 
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determinan el sistema lineal Ax = b, donde 


2ho ho Ое A A Фат ай ж ө ө #саса жоё жоё а 0 
ho 2+) hw Ue 
Аг ты 9 е | |а 
З s т. Ж -ó 
: pa 2(hn-2 + 1)" а 
ЖОООК КУУС КОЛАТ! ha 2-1 
a — a) — 3 f'(a) 
к (a — а) — ¿(ar — a) co 
C1 
b = » y х= |. 
262% = аһ) БЕ a Cni ка аһ—2) Es 


3 f'(b) = 55 (a = Ap-1) 


Esta matriz A también es estrictamente dominante de manera diagonal, por lo que satis- 
face las condiciones del teorema 6.21 en la sección 6.6. Por lo tanto, el sistema lineal tiene 
una solución única para Co, с\,... , Сп. н 


La solución del problema de spline cúbico con condiciones de frontera S’ (xo) = f'(x0) 
y S' (xn) = f'(x,) se puede obtener al aplicar el algoritmo 3.5. 
Spline cúbico condicionado 
Para construir el spline cúbico interpolante S para la función f definida en los números 


Xo < < -+> < Xn, que satisfacen S’ (xo) = f'(xo) y S (xn) = F (Xp): 


ENTRADA n; хо; Xt, --. , Xn; ao = f(x0o), 01 = f(x1),... ,an = ЈО); FPO = f'(xo); 
FPN = f'(xp). 


SALIDA aj,bj,cj,dj para j =0,1,...,n— 1. 
(Nota: S(x) = S¡(x) =a;+bj(x —=x y) + cja xj)? +4 (х – х) para x; <x Ж Жл.) 


Paso 1 Parai=0,1,...,n—1lhagah;=X¡41 — х;. 


Paso 2 Haga оо = 3(aı — aọ)/ ho — ЗЕРО; 
Qn = 3FPN — 3 (an = An-1)/Mp-1. 


Paso 3 Рага ¡=1,2,...,n—1 


_ ( ) 
Р а; a¡-1). 


Paso 4 Haga ly = 2hp; (Los pasos 4, 5 y б y parte del paso 7 resuelven un sistema lineal 
tridiagonal con un método descrito en el algoritmo 6.7.) 


3 
haga a; = т CH —а@)— 


Mo = 0.5; 
20 = &o/ lo. 
Paso 5 Parai=1,2,...,n—1 
haga l; = 2(х ы = Xi-1) — Mj-1Mj-15 
ш = hi/li; 
z= (о = hj-12-1)/l;. 


116 CAPÍTULO 3 = Interpolación y aproximación polinomial 


Paso 6 Haga l, = һ,_1(2 — Mn-1); 
Zn = (о = ћа1п-1)/ 1; 
С 
Paso 7 Рага ј = п – 1, п – 2,...,0 
haga су = Zj = MjCj415 
bj = (арны —a;)/hj — ћу (су + 2с) /3; 
d; = (с)+1 = cj)/Gh;). 
Paso 8 SALIDA (aj, Б;, су, й; para j = 0, 1,...,п — 1); 
PARE. ш 


Ejemplo 4 Еп el ejemplo 2 se usó un spline natural y los puntos de datos (0, 1), (1, e), (2, е?) у (3, е?) 
рага formar una nueva función de aproximación S(x). Determine el spline condicionado 5(х) 
que utiliza estos datos y la información adicional, f'(x) = е", /' (0) =1yf'G)=e?. 


Solución Сото en el ejemplo 2, tenemos n = 3, ло = hı = ћ = 1, ад = 0, а = е, 
a = e?, y аз = е? Esto, junto con la información que f'(0) = 1 y f'(3) = е?, da la matriz 
A y los vectores b y x con las formas 


21.00 3(e —2) со 
_[14 10 | 3(e2—2e+1) le 
А= A A A 

0.0 1 2 Зе? сз 


La ecuación matriz-vector Ах = b es equivalente al sistema de ecuaciones 
2co + сү = 3(е — 2), 
co +4c1 +c =3(e* — 2e +1), 
сү +H4c2 + сз = 3(e? — 2e? + e), 


со +2c3 = Зе: 


Resolviendo este sistema simultáneamente рага со, ст, с2 у сз obtenemos, con cinco lugares 
decimales, 


Co = Toe — 12e? + 42e — 59) = 0.44468, 
с = ae + 24e? — 39e + 28) = 1.26548, 
с = Ease — 39e? + 24e — 8) = 3.35087, 
сз = сте + 42е? — 12e + 4) = 9.40815. 


Al resolver para las constantes restantes de la misma manera que en el ejemplo 2 obtenemos 


Ро = 1.00000, bı = 2.71016, b = 7.32652, 


dọ = 0.27360, dı = 0.69513, Ф = 2.01909. 


Ilustración 
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Esto nos da el spline cúbico condicionado 


1 + x +0.444681? + 0.27360х3, si0<x <1, 
s(x) = { 2.71828 + 2.71016(х—1) + 1.26548 (x—1)? + 0.69513(x—1)}, sil<x < 2, 
7.38906 + 7.32652(x—2) + 3.35087 (x—2)? + 2.01909(x—2)}3, si2<x <3. 


La gráfica del spline condicionado y f(x) = e* son tan similares que no es posible observar 
diferencias. п 


También podemos aproximar la integral de f en [0, 3] al integrar el spline condicionado. 
El valor exacto de la integral es 


3 
/ ех dx = е? — 1 ~ 20.08554 — 1 = 19.08554. 
0 


Puesto que los datos están igualmente espaciados, integrar por tramos el spline condicionado 
resulta en la misma fórmula que en (3.22); es decir, 


3 
j 1 
/ s(x) dx = (ao +а +42) + 7 (Фо + bi + b2) 
0 
1 1 
+ 36% + с +2) + 40% +4 + do). 
Por lo tanto, la aproximación de integral es 


ч 1 
/ s(x) dx = (1 + 2.71828 + 7.38906) + 1 + 2.71016 + 7.32652) 
0 


1 1 
+ z 044468 + 1.26548 + 3.35087) + 29:27360 + 0.69513 + 2.01909) 


= 19.05965. 
El error absoluto en la aproximación integral usando los splines naturales y condicionados es 


Natural: |19.08554 — 19.55229| = 0.46675 


Condicionado: |19.08554 — 19.05965| = 0.02589. 


Para propósitos de integración, el spline condicionado es inmensamente superior. Esto no 
debería ser una sorpresa porque las condiciones de frontera para el spline condicionado son 
exactas, mientras que para el spline natural fundamentalmente asumimos que, f” (х) = е", 


0= 5"(х) а р" (0) =е=1 y 0=8"8)" fB) = еЗ ғ 20. 


La siguiente ilustración usa un spline para aproximar una curva que no tiene una repre- 
sentación funcional. 


La figura 3.11 muestra un pato malvasia en vuelo. Para aproximar el perfil superior del pato 
hemos seleccionado puntos a lo largo de la curva por los cuales queremos que pase la curva 
de aproximación. La tabla 3.18 enumera las coordenadas de 21 puntos de datos relativos al 
sistema de coordenadas superpuesto que se muestra en la figura 3.12. Observe que se usan 
más puntos cuando la curva cambia rápidamente que cuando lo hace más despacio. 
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Figura 3.11 
Tabla 3.18 
x [0.9 1.3|1.9 |21 |2.6|30\3.9)44 |47 |50|6.0 |70 80 |92 |10.5|113 11.6|12.0|12.6|13.0 13.3 
Ро) 13 1.5 1.85|2.1 |2.6|2.7|24|2.15|2.05|2.1|2.25|23 225195 14) 0.9 07| 06 0.5] 04| 025 
Figura 3.12 


El uso del algoritmo 3.4 para generar el spline cúbico natural para estos datos produce 
los coeficientes que se muestran en la tabla 3.19. Esta curva spline es casi idéntica al perfil, 
como se muestra en la figura 3.13. 


Tabla 3.19 


Figura 3.13 
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j х} а, bj с) d; 
0 0.9 1.3 0.54 0.00 —0.25 
1 1.3 1.5 0.42 —0.30 0.95 
2 1.9 1.85 1.09 1.41 —2.96 
3 2.1 2]. 1.29 —0.37 —0.45 
4 2.6 2.6 0.59 — 1.04 0.45 
5 3.0 2.1 —0.02 —0.50 0.17 
6 3.9 2.4 —0.50 —0.03 0.08 
7 4.4 2.15 —0.48 0.08 1.31 
8 4.7 2.05 —0.07 1.27 —1.58 
9 50 2.1 0.26 —0.16 0.04 

10 6.0 225 0.08 —0.03 0.00 

11 70 2,3 0.01 —0.04 —0.02 

12 8.0 225 —0.14 —0.11 0.02 

13 9.2 1.95 —0.34 —0.05 —0.01 

14 10.5 14 —0.53 —0.10 —0.02 

15 11.3 0.9 —0.73 —0.15 1:21 

16 11.6 0.7 —0.49 0.94 —0.84 

17 12.0 0.6 —0.14 —0.06 0.04 

18 12.6 0.5 —0.18 0.00 —0.45 

19 13.0 0.4 —0.39 —0.54 0.60 

20 13.3 0.25 


Para propósitos de comparación, la figura 3.14 proporciona una ilustración de la curva 
que se genera con un polinomio de interpolación de Lagrange para ajustar los datos provistos 
en la tabla 3.18. En este caso, el polinomio de interpolación es de grado 20 y oscila en forma 
desordenada. Produce una ilustración muy extraña de la espalda del pato, en vuelo o de otra 
forma. 
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Figura 3.14 


Teorema 3.13 


Al utilizar un spline condicionado para aproximar esta curva, necesitaríamos derivar 
aproximaciones para los extremos. Incluso si estas aproximaciones están disponibles, po- 
dríamos esperar poca mejora debido al acuerdo cerrado del spline cúbico natural para la 
curva del perfil superior. Г 


Construir un spline cúbico para aproximar el perfil inferior del pato malvasía sería más 
difícil porque la curva para esta parte no se puede expresar como una función de x, y en cier- 
tos puntos la curva no parece ser suave. Estos problemas se pueden resolver usando splines 
separados para representar varias partes de la curva, pero en la siguiente sección se considera 
un enfoque más eficaz para aproximar las curvas de este tipo. 

En general, al aproximar funciones mediante splines cúbicos son preferibles las condicio- 
nes de frontera condicionada, por lo que la derivada de la función debe conocerse о aproxi- 
marse en los extremos del intervalo. Cuando los nodos están espaciados uniformemente cerca 
de ambos extremos, es posible obtener las aproximaciones con cualquiera de las fórmulas 
adecuadas provistas en las secciones 4.1 y 4.2. Cuando los nodos no están espaciados de 
manera uniforme, el problema es considerablemente más difícil. 

Para concluir esta sección, listamos una fórmula de la cota de error para el spline cúbico 
sujeto a condiciones de frontera. La prueba de este resultado se puede encontrar en [Schul], 
pp. 57-38. 


Sea f e С“[а, b] con máx ¿<r<» | FP (x)| = M. Si S es el único spline cúbico condicionado 
interpolante para f respecto а los nodos а = ху < ху < +++ < Xn = b, entonces, para todas 
las x en [a, b]. 


5M . ; 
ШЕЗ, = S(x)| == аваа = xj) А ш 


<п 


Un resultado de la cota del error de cuarto orden también se mantiene рага el caso de las 
condiciones de frontera natural, pero es más difícil de expresar (consulte [BD], pp. 827-835). 

En general, las condiciones de frontera natural proporcionarán resultados menos preci- 
sos que las de frontera condicionada cerca de los extremos del intervalo [хо xn] a menos que 
la función f satisfaga (хо) = f”(xn) = 0. Una alternativa para la condición de frontera 
natural que no requiere conocimiento de la derivada de f es la condición sin nudo (consulte 
[Deb2], pp. 55—56). Esta condición requiere que S$” (х) sea continua en ху y Xn-1- 


La sección Conjunto de ejercicios 3.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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Figura 3.15 


Ejemplo 1 


Tabla 3.20 


Ninguna de las técnicas desarrolladas en este capítulo puede usarse para generar curvas de 
la forma que se muestra en la figura 3.15, porque esta curva no se puede expresar como una 
función de una variable coordenada en términos de la otra. En esta sección veremos cómo 
representar curvas generales al usar un parámetro para expresar tanto las variables x como y. 
Cualquier buen libro sobre gráficas computacionales mostrará cómo es posible ampliar esta 
técnica para representar curvas generales y superficies en el espacio (consulte, por ejemplo, 
[FVFH].) 


Una técnica paramétrica sencilla para determinar un polinomio o un polinomio por tra- 
mos para conectar los puntos (хо, уо), (х1, Y1), . . - (Xn, Yn) en el orden provisto consiste en 
usar un parámetro ѓ en un intervalo [%, tn], con fp < ti < -+ < tn y construir funciones de 
aproximación con 


x=x(8) у yi=y(t¡), paracada i = 0, 1,..., и. 


El siguiente ejemplo muestra la técnica en el caso en que ambas funciones de aproxima- 
ción son polinomios de interpolación de Lagrange. 


Construya un par de polinomios de Lagrange para aproximar la curva que se muestra en la 
figura 3.15, usando los puntos de datos en la curva. 


Solución Existe flexibilidad al seleccionar el parámetro y nosotros elegiremos los puntos 
{ti} o igualmente espaciados en [0, 1], lo cual provee los datos en la tabla 3.20. 


0 1 2 3 4 
ti 0 0.25 0.5 0.75 1 
Xi —1 0 1 0 1 


Yi 0 1 0.5 0 -j 
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Esto produce los polinomios de interpolación 
х@) = (((64 – 2) 1460): - LB) 1-1 y у(0) = (((— +48): 40) 1+11)1. 


Trazar este sistema paramétrico produce la gráfica que se muestra en azul en la figura 
3.16. Aunque pasa por los puntos requeridos y tiene la misma forma básica, es una aproxima- 
ción bastante burda para la curva original. Una aproximación más precisa requeriría nodos 
adicionales, con el consiguiente incremento en computación. п 


Figura 3.16 


(х@), y (0) 


Las curvas paramétrica de Hermite y de spline se pueden generar de forma similar, pero 
esto también requiere un gran esfuerzo computacional. 

Las aplicaciones de gráficas computacionales requieren la generación rápida de curvas 
suaves que se pueden modificar de manera fácil y rápida. Por razones tanto estéticas como 
computacionales, cambiar una parte de estas curvas debería tener un efecto pequeño o nin- 
gún efecto en otras partes de las curvas. Esto elimina el uso de polinomios de interpolación 

Р сот y splines уа que cambiar una parte de estas curvas afecta su totalidad. 

ренда еннан А La selección de la curva para usarla en gráficas computacionales es, en general, una 
computacional exitoso necesita z ? 

estar basado en una teoría forma de polinomio Hermite cúbico por tramos. Cada parte de un polinomio de Hermite 
matemática formal, de tal cúbico se completa totalmente al especificar sus extremos y las derivadas en estos extre- 
sa O mos. Por consiguiente, una parte de la curva se puede cambiar mientras la mayor parte de 
2 ө а! еп segundo la misma se deja igual. Sólo las partes adyacentes necesitan modificarse para garantizar la 
plano para que el artista pueda suavidad en los extremos. Los cálculos se pueden realizar rápidamente y es posible cambiar 
basar el diseño en la estética. una sección de la curva a la vez. 

El problema con la interpolación de Hermite es la necesidad de especificar las derivadas 
en los extremos de cada sección de la curva. Suponga que la curva tiene n + 1 puntos de datos 
(x (to), y (to), - - - (A (tn), y (t)) y deseamos parametrizar el cúbico para permitir caracterís- 
ticas complejas. Entonces, debemos especificar x'(t;) y y'(t;), para cada i = 0, 1, ..., п. Esto 
no es tan difícil como parece ya que cada parte se genera de manera independiente. Sólo de- 
bemos garantizar que las derivadas en los extremos de cada parte coincidan con los de la par- 
te adyacente. En esencia, entonces, podemos simplificar el proceso en uno que determine un 
par de polinomios de Hermite cúbicos en el parámetro г, donde г, = 0 y г, = 1, dados los datos 
del extremo (x(0), у(0)) y O), у(1)) y las derivadas dy/dx (en t = 0) y dy/dx (ent = 1). 
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Sin embargo, observe que sólo especificamos seis condiciones y los polinomios cúbicos 
en x(t) y y(t), cada uno tiene cuatro parámetros, para un total de ocho. Esto proporciona 
flexibilidad al seleccionar el par cúbico de polinomios de Hermite para satisfacer las con- 
diciones porque la forma natural para determinar x(t) y y(t) requiere que especifiquemos 
x'(0),x"(1), y'(0), y y'(1). La curva de Hermite explícita en x y y requiere especificar sola- 
mente los cocientes 


y'(0) 
x'(0) 


y (1) 
x (1) 


Al multiplicar х'(0) y у'(0) por un factor de escala común, la recta tangente para la curva 
en (x(0), y(0)) permanece igual, pero la forma de la curva varía. Mientras más grande sea el 
factor de escala, más cerca está la curva de aproximación a la recta tangente en las cercanías 
de (x(0), y(0)) . Existe una situación similar en el otro extremo (x(1), у(1)). 

Para simplificar más el proceso en las gráficas computacionales interactivas, la derivada 
en un punto extremo se especifica usando un segundo punto, llamado punto guía, en una 
recta tangente deseada. Mientras más lejos esté del nodo, más cerca se aproxima la curva a 
la recta tangente cerca del nodo. 

En Ја figura 3.17 los nodos se presentan en (хо, yo) y (х1, y1), el punto guía para (хо, уо) 
es (хо + &o, уо + Во), y el punto guía para (х1, ут) es (xı — ол, yı — B1). El polinomio de 
Hermite cúbico x(t) en [0, 1] satisface 


dy dy 
FP ) FPN ) 


х(0) = хо, х(1) = х, x0) = оо, y x“()=0. 


El único polinomio cúbico que satisface estas condiciones es 


x(t) = [2(x%0 — x1) + (оо + о)]? + [3х1 — xo) — (01 + 200318 + оог + xo. (3.23) 


De manera similar, el único polinomio cúbico que satisface 


у00) = у, 50) =, yO = В, у Yy0)=Bi 


еѕ 


у@) = 200 — y1) + ( + EDIP + [301 — yo) — (В + 28014 + Вог + уо. (3.24) 


Figura 3.17 


(хо + ao, Yo + Во) 


(= а, у В)) 


(х0, Yo) 


@ y1) 
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Ejemplo 2 


YA 


Puntos guía 
к. 


(0,1) ж (1,1) 


+ 
(0,0) (1,1) x 


Figura 3.18 


Pierre Etienne Bézier (1910— 
1999) fue director de diseño y 
producción de los automóviles 
Renault durante la mayor 

parte de su vida profesional. 
Comenzó su investigación en 
diseño y fabricación asistidos 
por computadora en 1960, 
desarrollando herramientas 
interactivas para el diseño de 
curvas y superficies, e inició 

el bobinado generado por 
computadora para modelado 

de automóviles. Las curvas de 
Bézier que llevan su nombre 
tienen la ventaja de estar basadas 
en una teoría matemática 
rigurosa que no necesita ser 
reconocida explícitamente por 

el practicante, quien sólo quiere 
crear una curva o superficie 
agradable desde el punto de vista 
estético. Éstas son las curvas que 
son la base del poderoso sistema 
Adobe Postscript y producen 
curvas a mano alzada generadas 
en la mayoría de los paquetes 
gráficos computacionales 
suficientemente potentes. 
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Determine la gráfica de la curva paramétrica generada por las ecuaciones (3.23) y (3.24) 
cuando los extremos son (хо, уо) = (0, 0) y (хі, y1) = (1,0) y los puntos guía respectivos, 
como se muestra en la figura 3.18 son (1, 1) y (0, 1). 


Solución La información del extremo implica que xy = 0, ху = 1, yo = 0, y yı = 0, y los 
puntos guía (1, 1) y (0, 1) implican que оо = 1, о = 1, Во = 1, y В: = —1. Observe que las 
pendientes de las rectas guía en (0, 0) y (1, 0) son, respectivamente, 

Bo 1 Br Geal 


=] ==; 


æo 1 01 1 


Las ecuaciones (3.23) y (3.24) implican que para є [0, 1], tenemos 


х@) =200— 1) + (1+D]é +[30—0)-(1+2-D]+1-1+0=+ 


y (2) =[2(0 — 0) + (1 + EDIÉ + [30 – 0) – 14+2-D14+1-1++0=- ++. 


Esta gráfica se muestra como a) en la figura 3.19, junto con algunas otras posibilidades 
de curvas producidas por las ecuaciones (3.23) y (3.24) cuando los nodos son (0, 0) y (1, 0) 
y las pendientes de estos nodos son 1 y — І, respectivamente. п 


El procedimiento estándar para determinar las curvas en un modo gráfico interactivo 
es utilizar primero un mouse (o ratón) o touchpad (panel táctil) y establecer los nodos y 
los puntos guía para generar una primera aproximación a la curva. Esto se puede hacer de 
manera manual, pero muchos sistemas de gráficas permiten utilizar su dispositivo de entrada 
para trazar la curva en una pantalla a mano alzada y seleccionar los nodos y puntos guía 
adecuados para su curva a mano alzada. 

A continuación, los nodos y los puntos guía se pueden manipular en una posición que 
genera una curva agradable desde el punto de vista estético. Puesto que los cálculos son 
mínimos, la curva se puede determinar tan rápido que el cambio resultante se aprecia de 
inmediato. Además, todos los datos necesarios para calcular las curvas están incorporados 
en las coordenadas de los nodos y puntos guía, por lo que no se requiere que el usuario tenga 
conocimiento analítico. 


JA JA 
(1,10) 
140,1) 21,1) 17 2 
N A 7 
N PS Y 
Ss E Y 
^ ГА ГА 
м Y z 
м i p 
A Y 
Pa E у 
Y E Y А (0.75,0.25) 
Y, %. EA Si 
Le Y 
| > | > 
2 X 1 2 х 


а) b) 
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YA 


(0.5, 0.5) 
ә 


Р 
N + 
=y 


c) d) 


Los programas de gráficos populares usan este tipo de sistema para sus representaciones 
gráficas a mano alzada en una forma ligeramente modificada. Los cúbicos de Hermite se des- 
criben como polinomios de Bézier, los cuales incluyen un factor de escala de tres al calcular 
las derivadas en los extremos. Esto modifica las ecuaciones paramétricas para 


х@) = [2x0 — x1) + 3(00 + ол) + [301 — хо) — 3(0 + 209)147 + 3001 + хо (3.25) 


y (1) = [200 — y1) + 3(% + б]? + [301 — yo) — 3(B1 + 280)17 + 3 Bot + yo, (3.26) 


рага 0 < т < 1, pero este cambio es transparente рага el usuario del sistema. 
El algoritmo 3.6 construye un conjunto de curvas de Bézier con base en las ecuaciones 
paramétricas en las ecuaciones (3.25) y (3.26). 


Curva de Bézier 


Para construir las curvas cúbicas de Bézier Co, ... , С„— en forma paramétrica, donde С; 
está representado por 


ilt), yit) = (а +аў apr aðr, bË +ь? +PEP bP), 


para O < г < 1, como se determina mediante el extremo izquierdo (x;, у;), el punto guía 


С , y? ), el extremo derecho (хт, угт), y el punto guía derecho (х. у, уду) рага cada 
¿¡=0,1,...,n—1: 


ENTRADA n; (хо, »),... О а а lr (хү,ур),..., (К, ур). 


SALIDA coeficientes (ay а; Da “Ош Ор, Ов, © b, Ob, Opara O<i<n-—1). 
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Paso 1 Para cada i = 0, 1,... ,n— 1 haga los pasos 2 y 3. 
Paso 2 Haga аў =; 
но = у 
а? =3(x =); 
bP = 3(уў — у); 
аз) = 3 + хр — 2); 
bP =3(% + ур – 2); 


а? == Mia == 3х = Зх 1> 


Б) = yigi — yi Зу – Зуд: 
Paso З SALIDA (aa af, af, bË, bË, bP, ВО, 
Paso 4 PARE. ш 


Las curvas tridimensionales se generan de la misma forma al especificar adicionalmente 
terceros componentes zo y 21 para los nodos y Zo +Yo У 21 —Y1 рага los puntos guía. El proble- 
ma más difícil que implica la representación de las curvas tridimensionales se preocupa por 
la pérdida de la tercera dimensión cuando la curva se proyecta en una pantalla bidimensional 
de computadora. Se utilizan varias técnicas de proyección, pero este tema se encuentra den- 
tro del campo de las gráficas por computador. Para una introducción a este tema y las mane- 
ras en las que la técnica se puede modificar para las representaciones de superficie, consulte 
alguno de los muchos libros sobre métodos gráficos por computadora como [ЕУЕН]. 


La sección Conjunto de ejercicios 3.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


FEN 3.7 Software numérico y revisión del capítulo 


Las rutinas de interpolación incluidas en la Biblioteca IMSL se basan en el libro A practical 
Guide to Splines (Una guía práctica para splines) de Carl de Boor [Deb] y usan la inter- 
polación mediante splines cúbicos. Existen splines cúbicos para minimizar las oscilaciones 
y preservar la concavidad. Los métodos para interpolación bidimensional mediante splines 
bicúbicos también se incluyen. 

La biblioteca NAG contiene subrutinas para la interpolación polinomial y de Hermite, 
para interpolación de spline cúbico y para interpolación de Hermite cúbico por tramos. NAG 
también contiene subrutinas para funciones de interpolación de dos variables. 

La biblioteca netlib contiene las subrutinas para calcular el spline cúbico con varias con- 
diciones de extremo. Un paquete produce los coeficientes de diferencia dividida de Newton 
para un conjunto discreto de puntos de datos y existen diferentes rutinas para evaluar los 
polinomios por tramos de Hermite. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Diferenciación numérica e integración 


Introducción 


Una hoja de tejado corrugado se construye al presionar una hoja plana de aluminio dentro de 
otra cuya sección transversal tiene la forma de una onda senoidal. 


Se necesita una hoja corrugada de 4 pies de largo, la altura de cada onda es de 1 pulgada 
desde la línea central y cada onda tiene un periodo de aproximadamente 2л. El problema de 
encontrar la longitud de la hoja plana inicial consiste en encontrar la longitud de la curva de- 
terminada por f(x) = sen x desde x = 0 pulgadas hasta x = 48 pulgadas. A partir del cálculo, 
sabemos que esta longitud es 


48 48 
ыз Yara | y 1 + (соѕ х)2 dx, 
0 0 


por lo que el problema se reduce a evaluar esta integral. A pesar de que la función senoidal 
es una de las funciones matemáticas más comunes, el cálculo de su longitud implica una 
integral elíptica de segunda clase, que no se puede evaluar de manera explícita. En este ca- 
pítulo se desarrollan métodos para aproximar la solución a los problemas de este tipo. Este 
problema particular se considera en el ejercicio 21 de la sección 4.4, en el ejercicio 15 de la 
sección 4.5 y en el ejercicio 10 de la sección 4.7. 

En la introducción del capítulo 3 mencionamos que una razón para usar polinomios 
algebraicos para aproximar un conjunto arbitrario de datos es que, dada cualquier función 
continua definida dentro de un intervalo cerrado, existe un polinomio que está arbitrariamen- 
te cerca de la función en cada punto del intervalo. Además, las derivadas y las integrales de 
los polinomios se obtienen y evalúan con facilidad. No debería sorprender, entonces, que 
muchos procedimientos para aproximar derivadas e integrales utilicen los polinomios 
que aproximan la función. 
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4.1 


Isaac Newton usó y popularizó 
las ecuaciones de diferencias 

en el último cuarto del siglo 

хуп, pero muchas de estas 
técnicas fueron desarrolladas 
previamente por Thomas Harriot 
(1561-1621) y Henry Briggs 
(1561-1630). Harriot realizó 
avances significativos en técnicas 
de navegación y Briggs fue la 
persona más responsable de 

la aceptación de logaritmos como 
auxiliares para el cálculo. 


Diferenciación numérica 


La derivada de la función fen xo es 


~ f&o+h)— f(x) 
ím . 
>0 h 


Ра) =] 


Esta fórmula proporciona una forma obvia de generar una aproximación para f'(xo); sim- 
plemente calcule 


Хо +h) — f(xo) 
h 


para valores pequeños de h. Aunque esto puede ser obvio, no tiene mucho éxito debido a 
nuestro antiguo némesis, el error de redondeo. Sin embargo, es un lugar para empezar. 

Para aproximar f'(x0), suponga primero que хо € (a,b), donde f e C?la, Б], y 
que xı = хо +л para alguna h 4 0, que es suficientemente pequeña para garantizar que 
xı € [а, Б]. Nosotros construimos el primer polinomio de Lagrange Po (х) para f determi- 
nado por хоу xı, con su término de error: 


уо) = Porto + LCR нал) 
2 00 = h) + Fo + Da — хо) + (x — wa Xo — D mE, 
para algunos £(x) entre хоу xı. Derivando obtenemos 
Fis Fo + Е — f (xo) +D, (х — waz xo — h) PEE) 
_fœ+ 2 460) 20) pr) 
— —x0—h 
AAA ECON) 


Borrando los términos relacionados con (x) obtenemos 


Fo +h) = f(x) 
| . 


Pu) 


Una dificultad con esta fórmula es que no tenemos información sobre Р, /"(&(х)), por lo 
que el error de truncamiento no se puede calcular. Cuando x es хо, sin embargo, el coeficiente 
de Dy f"(£(x)) es 0 y la fórmula se simplifica en 


/ бо +h)— f (xo) 
h 


h „ 
Fu) = 57 (5). (4.1) 
Рага los valores pequeños de Л, el cociente de diferencia [f (xo +A) — F(x0)1/h se 
puede utilizar para aproximar f'(xp) con un error acotado por M|A|/2, donde M es una cota 
de | f” (x)| para x entre xo y xo + h. A esta fórmula se le conoce como fórmula de diferencias 
hacia adelante si h > 0 (véase la figura 4.1) y como fórmula de diferencias hacia atrás 
sih < 0. 


Figura 4.1 


Ejemplo 1 


Tabla 4.1 
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Pendiente f'(xp) 


/О + h) = Fo) 


Pendient 
endiente п 


Use la fórmula de diferencias hacia adelante para aproximar la derivada de f(x) = Іа х 
en хо = 1.8 mediante A = 0.1,Л = 0.05,у Л = 0.01 y determine las cotas para los errores 
de aproximación. 


Solución La fórmula de diferencias hacia adelante 


fa. +h) — /(1.8) 
h 


con h = 0.1 nos da 


In1.9—In1.8 0.64185389 — 0.58778667 


= = 0.5406722. 
0.1 0.1 
Puesto que f”(x) = —1/x? y 1.8 < & < 1.9, una cota para este error de aproximación es 
hf” h ‚1 
IRF EN = Ш < 0 = 0.0154321. 
2 2? 2(1.8)2 


Га aproximación y las cotas de error cuando Л = 0.05 y Л = 0.01 se encuentran de manera 
similar y los resultados se muestran en la tabla 4.1. 


F(18+h)- /(1.8) ЇЇ 

[ 18+1 

i JASEN) h 2(1.8)2 
0.1 0.64185389 0.5406722 0.0154321 
0.05 0.61518564 0.5479795 0.0077160 
0.01 0.59332685 0.5540180 0.0015432 


Puesto que f'(x) = 1/x, el valor exacto de f'(1.8) es 0.555, y en este caso la cota del 
error está bastante cerca del verdadero error de aproximación. Е 


Para obtener las fórmulas generales de aproximación a la derivada, suponga que 
(хо, х1,... , Xn} son (n + 1) números distintos en algún intervalo Гу que f e С"! (1). A 
partir del teorema 3.3 en la página 83, 


(x = х0) +++ (х — Xp) 


EM FOP EK), 


Ро) =X FaLa) + 


k=0 
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para algunos £(x) en 7, donde Ly(x) denota el k-ésimo coeficiente del polinomio de Lagran- 


ge para f en xo, X1,... , Xn. Al derivar esta ecuación obtenemos 
Й = - (х — х0): :: (х — Xp) п 
/'@®) = 2 SOL) + Р, ср) PEO) 
Шы Шы y y per (E). 


(п + 1)! 


De nuevo tenemos un problema al calcular el error de truncamiento а menos que х sea 
uno de los números ху. En este caso, el término que multiplica Р, [ "+0 (&(х))] es 0 y la 
fórmula se vuelve 


PEGO) II 


ray =Y rona) 769 


k=0 


Xj — Xx), (4.2) 


que recibe el nombre de fórmula de (n + 1) puntos para aproximar f'(x;). 

En general, el uso de más puntos de evaluación en la ecuación (4.2) produce mayor 
precisión, a pesar de que el número de evaluaciones funcionales y el crecimiento del error de 
redondeo disuade un poco esto. Las fórmulas más comunes son las relacionadas con tres y 
cinco puntos de evaluación. 

Primero derivamos algunas fórmulas útiles de tres puntos y consideramos aspectos de 
sus errores. Puesto que 


2х = ху = Хо 


(хо — x1) (хо — x2) ` 


(х — ху)(х — x2) 


Lo(x) = ‚ 
ее) 


tenemos у(х) = 


De igual forma, 
2x — Xo = ХІ 


(х2 — xo) (x2 — x1) ` 


2x — хо = X2 


(х =X) = x2) 


Іл(х) = у Lax)= 


Por lo tanto, a partir de la ecuación (4.2), 


ИИВ 25р = х1 = х0 2х; = Хо = х0 | 
FO) = Ро) E La 2] +/ 0а) E час. 
| 2ху = Хо = ХІ 1 Or. = e 
+ (a) E -— ==] ¿Me Ta өэ) 
КФ} 


рага cada j = 0, 1, 2, donde la notación $; indica que este punto depende de ху. 


Fórmulas de tres puntos 


Las fórmulas a partir de la ecuación (4.3) se vuelven especialmente útiles si los nodos están 
espaciados de manera uniforme, es decir, cuando 


ху = хо+й y x=x0+2h, paraalgunas h #0. 


Supondremos nodos igualmente espaciados a lo largo del resto de esta sección. 
Por medio de la ecuación (4.3) соп ху = хо, ху = хо + h, y x2 = хо + 2h obtenemos 


ms Е: Р 1 №2 о) 
F (х0) = Б 5160) +2/(х)— 570| + 34 (éo). 


Al hacer lo mismo para ху = xı obtenemos 


„If 1 Ж му 
=> Е + ¿100 - і (6) 
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y, рага Xj = X2, 
Я 1 [1 3 h? (з) 
Р Оо) = ү 5700) — 241) + = б) ia dd (&2). 


Puesto que xı = xo + h y х = ху + 2h, estas fórmulas también se pueden expresar 
como 


І 1[ 3 1 А ву 
f (х0) = А Е + л) – AS +21) + zI (£o), 
ы у 1 1 a e 
f (xo + ү. [5160 + 5760 ] =a (&1), y 
rf 3 № ау 
f (xo + 2h) = Я (760) =2f(x0 +A) + ¿Fo +20) + zT (87). 


Por cuestiones de conveniencia, la sustitución de la variable хо por хо + h se usa еп 
medio de la ecuación para cambiar esta fórmula por una aproximación рага /'(хо). Un cam- 
bio similar, ху para ху + 2h, se utiliza en la última ecuación. Esto nos da tres fórmulas para 
aproximar f'(x0) 


1 h? 
Р бо) = zzl 3S бю) +4 f (xo + h) — f (ro + 2h)] + 3190), 


Й 1 h? (3) 
Ў (х0) = эк бо —Л)+ ОНЕ yÍ “E Y 


1 h2 
Ро) = 17 бю — 2h) — 4 f (o һу) +3 (хо1+ 31962). 


Finalmente, observe que la última de estas ecuaciones se puede obtener a partir de la primera 
simplemente al reemplazar h por —h, de modo que en realidad sólo son dos fórmulas: 


Fórmula del extremo de tres puntos 
1 h? 
. Fo) = TU + 4f(x0 + А) – (хо +2h)] + 7060) (4.4) 


donde éo se encuentra entre хоу хо + 2h. 


Fórmula del punto medio de tres puntos 


1 h? 
y Јо) = арол FOG, (4.5) 


donde é; se encuentra entre xy — h y xo + h. 


A pesar de que los errores en las dos ecuaciones (4.4) y (4.5) son O(h®), el error en la 
ecuación (4.5) es aproximadamente la mitad del error en la ecuación (4.4). Esto porque 
la ecuación (4.5) utiliza datos en ambos lados de хо y la ecuación (4.4) los usa en un solo 
lado. También observe que f se debe evaluar solamente en dos puntos en la ecuación (4.5), 
mientras que en la ecuación (4.4) se necesitan tres evaluaciones. La figura 4.2 ilustra la apro- 
ximación producida a partir de la ecuación (4.5). La aproximación en la ecuación (4.4) es 
útil cerca de los extremos de un intervalo porque la información sobre f fuera del intervalo 
puede no estar disponible. 
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Figura 4.2 


Ejemplo 2 


Pendiente e + h) = fœ = һ)] 


Fórmulas de cinco puntos 


Los métodos presentados en las ecuaciones (4.4) y (4.5) reciben el nombre de fórmulas de 
tres puntos (aunque el tercer punto f (xo) no aparece en la ecuación (4.5)). De igual forma, 
existen fórmulas de cinco puntos que implican la evaluación de la función en dos puntos 
adicionales. El término de error para estas fórmulas es O(h). Una fórmula de cinco pun- 
tos común se usa para determinar las aproximaciones para la derivada en el punto medio. 


Fórmula del punto medio de cinco puntos 


1 [Ды 
6 Гоо) = gz; бо 2h) — 8 (о h) +87 (xo +A) — fo + 2Л)] + 496), 


(4.6) 
donde ё se encuentra entre xy — 2h y хо + 2h. 


La deducción de esta fórmula se considera en la sección 4.2. La otra fórmula de cinco puntos 
se usa para aproximaciones en los extremos. 


Fórmula del extremo de cinco puntos 


1 
e Р (о) = 72 1-25 0) + 48 f (хо +A) — 36 f (xo + 2h) 
4 
+ 16f (xo + 3h) — 3 f (xo + 4h)] + EFO, (4.7) 


donde ё se encuentra entre хо + 4h. 


Las aproximaciones del extremo izquierdo se encuentran mediante esta fórmula con h > 0 
y las aproximaciones del extremo derecho con h < 0. La fórmula del extremo de cinco puntos 
es especialmente útil para la interpolación de spline cúbico condicionado de la sección 3.5. 


Los valores para f(x) = хе" se dan en la tabla 4.2. Utilice las fórmulas aplicables de tres у 
cinco puntos para aproximar f'(2.0). 


Tabla 4.2 

x fœ) 
1.8 10.889365 
1.9 12.703199 
20 14.778112 
2.1 17.148957 
2.2 19.855030 
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Solución Los datos en la tabla nos permiten encontrar cuatro diferentes aproximaciones de 
tres puntos. Podemos usar la fórmula del extremo (4.4) con h = 0.1 o con h = —0.1, y la 
fórmula del punto medio (4.5) con h = 0.1 o con h = 0.2. 

Mediante la fórmula del extremo (4.4) con h = 0.1 obtenemos 


3/00) +4fQ.1)— f(2.2] = 5[-3(14.778112) + 4(17.148957) — 19.855030)] 


= 22.032310 


y con Л = —0.1 nos da 22.054525. 
Por medio de la fórmula del punto medio (4.5) con h = 0.1 obtenemos 


1 


95170-1) — /@.91 = 5(17.148957 — 12.7703199) = 22.228790 


y con Л = 0.2 nos da 22.414163. 
La única fórmula de cinco puntos para la que la tabla provee datos suficientes es la fórmula 
del punto medio (4.6) con h = 0.1. Esto nos da 


1 1 
ЕД =8 f (1.9) +87(02.1) – 0.2) = qa V 882363 — 8(12.703199) 
+ 8(17.148957) — 19.855030] 
= 22.166999. 


Si no tenemos más información, aceptaríamos la aproximación del punto medio de cinco 
puntos mediante h = 0.1 como la más apropiada y esperamos que el valor verdadero se en- 
cuentre entre esa aproximación y la aproximación del punto medio de tres puntos, es decir, 
en el intervalo [22.166, 22.229]. 

En este caso, el valor verdadero es f'(2.0) = (2 + 1)e? = 22.167168, por lo que, en 
realidad, los errores de aproximación son los siguientes: 


Extremo de tres puntos соп Л = 0.1: 1.35 х 107!; 
Extremo de tres puntos con h = —0.1: 1.13 x 107!; 
Punto medio de tres puntos con h = 0.1: —6.16 х 1072; 
Punto medio de tres puntos con Л = 0.2: —2.47 х 107!; 


Punto medio de cinco puntos con h = 0.1: 1.69 x 10*., a 

Los métodos también se pueden deducir para encontrar aproximaciones para derivadas 

superiores de una función que sólo usa valores tabulados de la función en diferentes puntos. 

La deducción es algebraicamente tediosa, sin embargo, sólo se presentará un procedimiento 
representativo. 


Represente una función f mediante la expansión de un tercer polinomio de Taylor sobre 
un punto xy y evalúe xo + h y хо — h. Entonces, 


/ у 2‚ Lem 3 1 (4) 4 
Sao +A) = fo) + F бо) + / бө) + ¿GOA +57 (80А 


А / 1 i 2 1 Mi 3 1 (4) 4 
Fo — A) = (хо) — f (xo)h + 57 (хо) — &7 (хо) + эд! (E-DA”, 


donde xy — h < & р < xo < ё < xo + A. 
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Ejemplo 3 


Tabla 4.3 

x Fx) 
1.8 10.889365 
1.9 12.703199 
20 14.778112 
2.1 17.148957 
2.2 19.855030 
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Si adicionamos estas ecuaciones, los términos relacionados con f'(xp) y — f(x) se 
cancelan, por lo que 


= " 2 1 (4) (4) 4 
Fo +A) + (хо A) = 2f (хо) + / (хо) + УТГА Ei) + E 


Al resolver esta ecuación рага f” (xo) obtenemos 


" 1 h? (4) (4) 
f (х) = q LF Co —=h)-2f(x0) + f o+ А) — z E1) + 6D] (4.8) 


Suponga que f® es continua en [xp — h, хо + h]. Puesto que HIP EN + FOE] se 
encuentra entre f® (£) y fP (E1), el teorema de valor intermedio implica que existe un 
número é entre & y &_ y, por lo tanto, en (xo — h, хо + Л) con 


JOE = > [OED + El: 
Esto nos permite reescribir la ecuación (4.8) en su forma final. 
Fórmula del punto medio de la segunda derivada 
fu) = LG = ћ) — 2f (х0) + f xo +hA)]— K ag, (4.9) 


Para algunos £, donde xy — h < & < xo + h. 


Sif ® es continua en [xo — h, xo + h], también está acotada, y la aproximación es 01m). 


En el ejemplo 2 utilizamos los datos que se muestran en la tabla 4.3 para aproximar la pri- 
mera derivada de f(x) = xe* en x = 2.0. Use la fórmula de la segunda derivada (4.9) para 
aproximar /"(2.0). 


Solución Los datos nos permiten determinar dos aproximaciones para f "(2.0). Usando (4.9) 
con h = 0.1 obtenemos 


1 
gogl 2) —2/@0) + /02.1)1 = 100[12.703199 — 2(14.778112) + 17.148957] 
= 29.593200, 


y mediante (4.9) con h = 0.2 obtenemos 


ав 2302.0) + f (2.2)] = 25[10.889365 — 2(14.778112) + 19.855030] 


= 29.704275. 


Puesto que f”(x) = (x +2)e*, el valor exacto es f”(2.0) = 29.556224. Por lo tanto, los 
errores reales son —3.70 x 107? y —1.48 х 107!, respectivamente. п 


Inestabilidad del error de redondeo 


Es especialmente importante prestar atención al error de redondeo al aproximar derivadas. 
Para ilustrar la situación, examinemos más de cerca la fórmula del punto medio de tres pun- 
tos, la ecuación (4.5). 


des h h а 
Р бо) = ¿[fo +A) = Fo M1 7 (1), 


Ilustración 


Tabla 4.4 
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Suponga que al evaluar f(x0+h) y (хо —h), encontramos los errores de redondeo 
e(xo + h) y е(хо — h). Entonces nuestros cálculos en realidad usan los valores f (xo +h) y 
Ў (хо — Л), que están relacionados con los valores verdaderos Ѓ(хо + Л) y (хо — h) mediante 


fao +h) = fo +h)+e@o+h) y f0=h)= fo- h) + е(хо —h). 


El error total en la aproximación, 


Fo +A) – Fo =h) _ elo +h) – elro — h) 


Ў o) 2h 2h 


h2 
6 А; 


se debe tanto al error de redondeo, Іа primera parte, como al error de truncamiento. Si supo- 
nemos que los errores de redondeo е(хо + h) están acotados por algún número e > 0 y que 
la tercera derivada de f está acotada por un número M > 0, entonces 


Foo +h) – } оо — h) m и 
2h h 6 


1 
f (xo) 
Para reducir el error de truncamiento h? М/6, necesitamos reducir h. Pero conforme Л se re- 
duce, el error de redondeo £/h crece. En la práctica, entonces, casi nunca es ventajoso dejar 
que h sea demasiado pequeña, porque en este caso, el error de redondeo dominará los cálculos. 


Considere utilizar los valores en la tabla 4.4. Para aproximar f'(0.900), donde f(x) = sen х. 
. El verdadero valor es cos 0.900 = 0.62161. La fórmula 


(0.900 + л) — F(0.900 — h) 


100.900) ~ 
f (0.900) 37 


con diferentes valores de h, proporciona las aproximaciones en la tabla 4.5. 


еа ѕеп х х sen х Tabla 4.5 Aproximación 

0.800 0.71736 0.901 0.78395 h AA Error 

0.850 0.75128 0.902 0.78457 0.001 0.62500 0.00339 
0.880 0.77074 0.905 0.78643 0.002 0.62250 0.00089 
0.890 0.77707 0.910 0.78950 0.005 0.62200 0.00039 
0.895 0.78021 0.920 0.79560 0.010 0.62150 —0.00011 
0.898 078208 0.950 0.81342 0.020 0.62150 —0.00011 
0.899 078270 1000 0.84147 0.050 0.62140 —0.00021 
A 0.100 0.62055 —0.00106 


La mejor opción para h parece encontrarse entre 0.005 y 0.05. Podemos utilizar el cálcu- 
lo para verificar (consulte el ejercicio 29) que se presenta un mínimo para 


D= т 
кырыну ез 


en Л = /3e/M, donde 


M= máx |/”(х)|=_ máx |соѕх| = соѕ0.8 ~ 0.69671. 
xel0.800,1.00] xel0.800, 1.00] 


Puesto que los valores de f están determinados para cinco lugares decimales, supondremos 
que el error de redondeo está limitado por £ = 5 х 107*. Por lo tanto, la mejor opción de Л 


es aproximadamente 
3/3(0.000005) 
h = į\| 5 — 7 0.028, 
0.69671 


que es consistente con los resultados en la tabla 4.6. 
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Tome en cuenta que las 
aproximaciones por método de 


diferencias pueden ser inestables. 


= Diferenciación numérica e integración 


En la práctica no podemos calcular una Л óptima para utilizarla en la aproximación de 
la derivada ya que no conocemos la tercera derivada de la función. Sin embargo, debemos 
seguir siendo conscientes de que reducir el tamaño del paso no siempre mejora la aproxi- 
mación. ш 


Sólo hemos considerado los problemas de error de redondeo presentados por la fór- 
mula de tres puntos, ecuación (4.5), pero se presentan dificultades similares con todas las 
fórmulas de diferenciación. La razón se puede rastrear a la necesidad de dividir entre una 
potencia de h. Como encontramos en la sección 1.2 (consulte, especialmente, el ejemplo 3), 
la división entre números pequeños tiende a exagerar el error de redondeo y, de ser posible, 
debería evitarse esta operación. En caso de diferenciación numérica, no podemos evitar el 
problema por completo, a pesar de que los métodos de orden superior reducen la dificultad. 

Al igual que los métodos de aproximación, la diferenciación numérica es inestable ya 
que los valores pequeños de h necesarios para reducir el error de truncamiento también 
causan que el error de redondeo crezca. Esta es la primera clase de métodos inestables que 
hemos encontrado y, de ser posible, estas técnicas deberían evitarse. Sin embargo, además 
de usarse para propósitos computacionales, las fórmulas son necesarias para aproximar las 
soluciones de ecuaciones ordinarias y diferenciales parciales. 


La sección Conjunto de ejercicios 4.1 está disponible en línea. Encuentre la ruta de 
acceso en las paginas preliminares 


N 4.2 Extrapolación de Richardson 


Lewis Fry Richardson (1881- 
1953) fue el primero en aplicar 


sistemáticamente las matemáticas 


a la predicción del tiempo 
mientras trabajaba en Inglaterra 
para la Oficina Meteorológica. 
Como opositor concienzudo 
durante la Primera Guerra 
Mundial, escribió ampliamente 
sobre la futilidad económica de 
la guerra, mediante sistemas 

de ecuaciones diferenciales para 
modelar interacciones racionales 
entre países. La técnica de 
extrapolación que lleva su 
nombre fue el redescubrimiento 
de una técnica con raíces que 
son tan antiguas como Christiaan 
Hugyens (1629-1695) y, 
posiblemente, Arquímedes 
(287-212 a.C.) 


La extrapolación de Richardson se usa para generar resultados de alta precisión mientras usa 
fórmulas de bajo orden. A pesar de que el nombre adjunto al método se refiere a un artículo 
escrito por L. F. Richardson y J. A. Gaunt [RG] en 1927, la idea detrás de la técnica es mucho 
más antigua. Un artículo interesante respecto a la historia y la aplicación de la extrapolación 
se puede encontrar en [Joy]. 

La extrapolación se puede aplicar siempre que se sepa que una técnica de aproximación 
tiene un término de error con un formato predecible, uno que depende de un parámetro, nor- 
malmente el tamaño de paso h. Suponga que para cada número h 5 0, tenemos una fórmula 
№ (h) que se aproxima a una constante M desconocida y que el error de truncamiento rela- 
cionado con la aproximación tiene la forma 


M — Ni (h) = Kih + Kah? + Ksh? +-->, 


para algún conjunto de constantes Ку, K2, Кз,... . (desconocidas). 
El error de truncamiento es O(h), a menos que haya una variación más grande entre las 
constantes Ку, Кә, K3,..., 


M — N: (0.1) ~ 0.1Kı, M-—N¡(0.01) ~ 0.01K;, 


у, en general, M — N¡(h) = КА. 

El objetivo de la extrapolación es encontrar una forma fácil de combinarlas en lugar de 
aproximaciones O(h) inapropiadas de manera adecuada para producir fórmulas con un error 
de truncamiento de orden superior. 

Suponga, por ejemplo, que podemos combinar las fórmulas N¡(h) para producir una 
fórmula de aproximación om, №(А), para М con 


M-—Nah) = Rak + Ёзи? +, 


para algún, nuevamente desconocido, conjunto de constantes Кэ, K3,.... Entonces tenemos 


М – №(0.1) ~ 0.012, М – №(0.01) ~ 0.0001 Å>, 
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y así sucesivamente. Si las constantes Kı y K> son aproximadamente de la misma magni- 
tud, entonces las aproximaciones N2(h) serían mucho mejores que las aproximaciones N¡(h) 
correspondientes. La extrapolación continúa al combinar las aproximaciones N2(h) de mane- 
ra que produce fórmulas con error de truncamiento O(h?) y así sucesivamente. 

Para observar específicamente cómo podemos generar las fórmulas de extrapolación, 
considere la fórmula О(Л) para aproximar М 


М =N (h) + Kih + Koh? + Кз? +- (4.10) 


Se asume que la fórmula se mantiene para todas las Л positivas, por lo que reemplazamos el 
parámetro h a la mitad de su valor. A continuación, tenemos una segunda fórmula de apro- 
ximación O(h) 

3 


} } h? h 
RES PR dl, (4.11) 


2 


M= ( 2 4 8 


Restando dos veces la ecuación (4.11) de la ecuación (4.10) se elimina el término relaciona- 
do соп К! y nos da 


h h no, п, 
м 0 (2) Тү (м) (E) 


(4.12) 
Defina 
h h 
Мә(һЛу=М,|—|+|М, |—|—М(Л)|. 
2 2 
Entonces, la ecuación (4.12) es una fórmula de aproximación om) para M: 
K 3K 
М = Na(h) 1° а тт (4.13) 


En el ejemplo 1 de la sección 4.1, utilizamos el método de diferencias hacia adelante con 
h = 0.1 y h = 0.05 para encontrar aproximaciones para f(1.8) para f(x) = In(x). Suponga 
que esta fórmula tiene error de truncamiento O(h). Use la extrapolación en estos valores para 
observar si esto resulta en una mejor aproximación. 


Solución En el ejemplo 1 de la sección 4.1, encontramos que 
соп h = 0.1: f'(1.8) 2 0.5406722, у сопл = 0.05: f'(1.8) ~ 0.5479795. 
Esto implica que 
№(0.1) =0.5406722 y М,(0.05) = 0.5479795. 
La extrapolación de estos resultados nos da la nueva aproximación 
N2(0.1) = N¡(0.05) + (№, (0.05) — N¡(0.1)) = 0.5479795 + (0.5479795 — 0.5406722) 
= 0.555287. 


Se encontró que los resultados Л = 0.1 y Л = 0.05 son precisos dentro de 1.5 х 10? y 7.7 
X 107°, respectivamente. Puesto que f'(1.8) = 1/1.8 = 0.5, el valor extrapolado es preciso 
dentro de 2.7 х 107“. ш 


La extrapolación se puede aplicar siempre que el error de truncamiento para una fórmula 
tenga la forma 


т—1 


Уке + Об”) 


j=l 
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рага un conjunto de constantes Ку y cuando оу < 05 < 03 < ··· < Œm. Muchas fórmulas 
utilizadas en la extrapolación tienen errores de truncamiento que sólo contienen potencias 
pares de h, es decir, tienen la forma 


М = Ni (h) + Kik? + Koht + К3А® +- . (4.14) 


La extrapolación es mucho más efectiva cuando todas las potencias de h están presentes de- 
bido а que el proceso de promediar genera resultados con errores O (h°), O(h), О(А%),..., 
con esencialmente, ningún incremento en el cálculo, sobre los resultados con errores 
O(h), O (hò), О(Һ?),.... 

Suponga que la aproximación tiene la forma de la ecuación (4.14). Al reemplazar h con 
h/2 obtenemos la fórmula de aproximación О(#?) 


M=N h id asn Е a 
id Es 4 216 a 


Al restar cuatro veces esta ecuación de la ecuación (4.14), se elimina el término 2, 


зм = ам (on lr (E (Em 
= = = — — р — —h E 
1 2 1 2 4 3 16 


Dividiendo esta ecuación entre 3, produce una fórmula o(n%) 


M 1 AN h N (h) 3 K ht р^ y K3 hê hê de 

= – = | – = | — =h — | = = А Өз. 
NA ! 314 з 116 

Al definir 


1 h h 1 h 
N2(h) = 3 эм (5) -m| = № (5) + 3 м (5) мо) 


produce la fórmula de la aproximación con error de truncamiento O(h?): 


ht 
M = Na(h) K- E E E (4.15) 


Ahora reemplace Ё en la ecuación (4.15) con h/2 para producir una segunda fórmula O(h) 


h ht 5h 
М = № К» 


K3 
2 64 1024 


Al restar 16 veces esta ecuación de la ecuación (4.15) elimina el término h y da 


15h6 
64 


Al dividir esta ecuación entre 15 produce la nueva fórmula OCh®) 


matan Na(h) ik & 
15 2\2 : 364 


Ahora tenemos la fórmula de aproximación О(}®) 


1 һ h 1 h 
N3(h) = 15 16м, G) = №0) = № (3) + 15 [ (5) м). 


Tabla 4.6 


Ejemplo 2 
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Al continuar con este procedimiento obtenemos, para cada j = 2, 3,..., la aproximación 
Oh») 
_ һ Nj;-1(4/2) = Nj-1(4) 
мю = м (7) + 4L] Я 


La tabla 4.6 muestra el orden en el que se generan las aproximaciones cuando 
M=Ni(M)+Kih?+Koh*+K3h8+-+... (4.16) 


Se supone de manera conservadora que el verdadero resultado es preciso por lo menos 
dentro del acuerdo de los dos resultados inferiores en la diagonal, en este caso, dentro de 
№3 (0) — Na(h)|. 


O(h?) O(h*) O(hS) O(h?) 


: М) 
: MÈ) 3: Na(h) 

: NÉ) 5: Na(2) 6: N3(h) 

МО) 8: Nah) 9: N(%) 10: Na(h) 


Ah Da 


El teorema de Taylor se puede utilizar para mostrar que la fórmula de diferencias centradas 
en la ecuación (4.5) para aproximar f'(xp) se puede expresar соп una fórmula de error: 


4 
(5) = 
120% (хо) , 


1 h? 
Ро) = if 00 + А) – /(хо h)] f” (хо) 
2h 6 
Encuentre las aproximaciones de orden om, Olh”), y О(һ°) рага f'(2.0) cuando f = xe* y 
ћ =0.2. 


Solución Probablemente, las constantes Кү = — f" (xo)/6, К = — f ® (x0)/120,---, se- 
rán desconocidas, sin embargo, esto no es importante. Sólo necesitamos saber que estas 
constantes existen con el fin de aplicar la extrapolación. 

Tenemos la aproximación 0(h?) 


/ =N h h? 1 h (5) 
Р (х0) = Ni (h) — yÍ (х0) — mo? (х0) – ··-, (4.17) 


donde 


1 
Ni (h) = 51700 +A) = Fo = №)]. 


Esto nos da las primeras aproximaciones O(h?) 


1 


N: (0.2) = 
TE 


[FQ.2) — f(1.8)] = 2.5(19.855030 — 10.889365) = 22.414160 


М\(0.1) = 


1 
—[fQ.1) — /(1.9)] = 5(17.148957 — 12.703199) = 22.228786. 


0.2 


Al combinarlas para producir la primera aproximación O(h*) obtenemos 


1 1 
N2(0.2) = N1 (0.1) + (0.1) — N1 (0.2)) = 22.228786 + 2 (22.228786 — 22.414160) 


= 22.166995. 
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1 1 
(х0 — h) = (хо) — f'(xo)h + ¿E Е ¿LON 
1 4_ aj 5 
ES о ION, (4.19) 


donde xy — h < & < xo < ё < xo + A. 
Al restar la ecuación (4.19) de la ecuación (4.18) obtenemos una nueva aproximación 


para f'(x)): 


Гоо +h) – (хо – №) = 2Af' (x0) po у") + 1 LAO ED + AOE, (4.20) 


lo cual implica que 


1 
Ро) = y, [400 +) – fo — №) PM H OROEN 
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Si f б) es continua en [xo — h, хо +h],el teorema del valor intermedio 1.11 implica que 
existe un número & en (хо — h, хо + Л) con 


z 1 
= PEA]: 


Como consecuencia, tenemos la aproximación O(h?) 


(о) = Lf +h) – f(x —h)] ж, = А E): (4.21) 

A pesar de que la aproximación en la ecuación (4.21) es igual a la que se obtuvo en la 

fórmula de tres puntos en la ecuación (4.5), ahora, el punto desconocido de evaluación se 

presenta en f® en lugar de en f”. La extrapolación aprovecha esto al reemplazar primero h 
en la ecuación (4.21) con 2h para producir la nueva fórmula 


1 
(хо) = zzl бю +2h) — f (xo – 2h)] K рта о) — B og, (4.22) 


donde Ё se encuentra entre хо — 2h y хо + 2h. 
Al multiplicar la ecuación (4.21) por 4 y restar la ecuación (4.22) produce 


2 1 
37 (х0) = Е œ + А) – (хо — №)] An [/ Оо + 2h) — f (xo — 2h)] 
4 4 
Lam 2 e 
IA GIN). 

Incluso si f (5 es continua en [xo — 2h, xo + 2h], el teorema de valor intermedio 1.11 no 
se puede aplicar como lo hicimos para derivar la ecuación (4.21) porque tenemos la diferen- 
cia de términos relacionados con f®. Sin embargo, es posible usar un método alterno para 
mostrar que f® (E) у f© (E) se puede seguir reemplazando con un valor común f® (&). 


Al suponer esto y dividir entre 3 produce la fórmula del punto medio de cinco puntos la 
ecuación (4.6) que observamos en la sección 4.1: 


1 ht 
/'бо) = yy LS o — 2h) – 8f (x0 h) + 8f бо +A) — f (xo +2/)]+ zf” G). ш 


Otras fórmulas para las primeras derivadas y las derivadas superiores se pueden deducir 
de manera similar. Consulte, por ejemplo, el ejercicio 8. 

A lo largo del texto se utiliza la técnica de extrapolación. Las aplicaciones más promi- 
nentes se presentan al aproximar las integrales en la sección 4.5 y al determinar soluciones 
aproximadas para las ecuaciones diferenciales en la sección 5.8. 
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La sección Conjunto de ejercicios 4.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Elementos de integración numérica 


A menudo surge la necesidad de evaluar la integral definida de una función que no tiene una 
antiderivada о cuya antiderivada no es fácil de obtener. El método básico asociado con la 
aproximación de f f(x) dx recibe el nombre de cuadratura numérica. Éste utiliza una 
suma У уа; f (xi) para aproximar f Р(х) ах. 

Los métodos de cuadratura en esta sección se basan en los polinomios de interpolación 
que se han explicado en el capítulo 3. La idea básica es seleccionar un conjunto de nodos 
distintos [Xo, . . . , Xn} del intervalo [a, b]. Entonces integramos el polinomio interpolante de 
Lagrange 


Р(х) = У FG6DLi() 
ї=0 


y su término de error de truncamiento sobre [a, b] para obtener 
b b n (п+1) 
jÍ E) 
(х) dx = f (х;)1(х) dx + [Tr х;) ах 
/ f a D Ў (п + 1)! 


п 1 b n | 
ыны со io х) Оа) ах, 


donde é(x) se encuentra en [a, b] para cada х у 
b 
а; = / L¡(x) dx, para cada i = 0, 1,...,n. 


La fórmula de cuadratura es, por lo tanto, 


n 


/ Ро) dx ~ Y a; ЈО), 


i=0 
con un error dado por 


bn 


1 
Е — y) f0+D 
E(f) = ml Це xi) (@&()) ах. 


Antes de analizar la situación general de las fórmulas de cuadratura, consideremos las 
fórmulas producidas mediante el uso del primer y del segundo polinomios de Lagrange con 
nodos igualmente espaciados. Esto da la regla trapezoidal y la regla de Simpson, las cuales 
se presentan generalmente en cursos de cálculo. 


La regla trapezoidal 


Para derivar la regla trapezoidal (o regla del trapecio) para aproximar | f(x)dx, sean 
хо = а,ху =b,h = Ь—а y utilice el polinomio de Lagrange 
(х (х 


х) 
Р(х) = па хо) + =— ps x1). 
(хо — (х1 
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Entonces 


b 
fra] 7 E а “= ota х) |а 
а хо 


(хо — Ca (4.23) 


popa 
+ F Л” (@@ (х))(х — xo) Œ — xı) dx. 
хо 


El producto (х — хо) (х — ху) no cambia de signo en [хо, х1], por lo que el teorema del valor 
promedio ponderado para integrales 1.13 se puede aplicar al término de error para obtener, 
para algunos é en (хо, x1), 


х] Xi 
] FUEGO) — хо) — xı) dx = rof (x — xo) (x — xı) dx 
хо xo 


Cuando usamos el término 3 Caba) х 
trapezoidal, nos referimos a _ pn X ХІ Xo) 2 
una figura de cuatro lados con =f 6) 5- 2 Ta AO А 
al menos dos lados paralelos. El % 
término europeo para esta figura h? 
es trapezium. Para confundir =-—f "(E ): 
más el tema, la palabra europea 6 
trapezoidal se refiere a una figura 2. А А 
de cuatro lados sin ningún lado Por consiguiente, la ecuación (4.23) implica que 
igual y la palabra estadounidense 
para este tipo de figura es (x А1 h? 
trapezium. | f(x)dx -|E E xo) + LE ja w| _ G) 
хо 
(х — хо) h? 
= — [fe + fE] < 7" (8). 
2 12 
Por medio de la notación h = xı — xo obtenemos la siguiente regla: 
Regla trapezoidal: 
b h h? 
f fœ) dx = 7140) +f- Ta 
Esto recibe el nombre de regla trapezoidal porque cuando fes una función con valores 
positivos, f f(x) dx se aproxima mediante el área de un trapecio, como se muestra en la 
figura 4.3 
Figura 4.3 


El término de error para la regla trapezoidal implica f”, por lo que la regla da el resultado 
exacto cuando se aplica a cualquier función cuya segunda derivada es idénticamente cero, es 
decir, cualquier polinomio de grado uno o menos. 
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Regla de Simpson 


La regla de Simpson resulta de la integración sobre [a, b] del segundo polinomio de 
Lagrange con nodos igualmente espaciados xy = а, x2 =b,y xı = а + h, en don- 
de h = (b — a)/2. (véase la figura 4.4). 


Figura 4.4 


Por lo tanto, 


b X2 Е __ = = 
[тоа | E x1)(x — x2) Fiod (х — хо)(х — x2) 0) 


xo Со = х1) (хо — x2) (хр — xo) (xı — x2) 


(х — хо)(х —x 


ela 


(x2 = xo) (о = x1) 


+f” (х — хо)(х HO x2) 


FUE) dx. 


0 


Al deducir la regla de Simpson de esta forma, sin embargo, da un solo término de error O(h*) 
relacionado con /). Al aproximar el problema de otra forma, se puede derivar otro término 
de orden superior relacionado con f ®. 

Para ilustrar este método alternativo, suponga que f se expande en el tercer polinomio de 
Taylor alrededor de x. Entonces, para cada x en [хо, x2], existe un número £(x) en (xo, хо) con 


FO = / Ол) + РО) — ху) + Í Da xı) + La — х)? 
(4) 
SE f се» (x= y 


ro ds [ræva мі Da a La =) 
хо 


f” œ) 
24 


(х – l 


X2 1 х2 
Кел J JOEA — х1) dx. (4.24) 


0 220) 


Puesto que (x — ху)“ nunca es negativo en [xo, хә], el teorema de valor promedio ponderado 
para las integrales 1.13 implica que 


E EN (4) = 4 _ fO G) e 4 Е FUE) Е 5 a 
n. 2 E)E — х) dx = м Ja (x—x1) dx = 1220 (х= х1)" |, 


Thomas Simpson (1710-1761) 
fue un matemático autodidacta 
que en sus primeros años se 
ganaba la vida como tejedor. Su 
principal interés fue la teoría 

de la probabilidad, aunque en 
1750 publicó un libro de cálculo 
de dos volúmenes titulado 

The Doctrine and Application 
of Fluxions (La doctrina y 
aplicación de fluxiones). 


Ejemplo 1 
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para algún número é; en (хо, x2). 
Sin embargo, Л = x2 — xı = х — хо, por lo que 
о) — (хо — x1)? = (х — x1)f — (xo — х)* = 0, 
mientras 
(х0 x1) – (хо – х1)? = 28° y (0x1) — (хо 1) = 2. 


Por consiguiente, la ecuación (4.24) se puede reescribir сото 


FUE, 
60 


xX h? 
/ Ra dx = 2hf (xı) + Z'a) + K, 
xo 


Ahora, si reemplazamos f”(x1) por medio de la aproximación determinada en la ecua- 
ción (4.9) de la sección 4.1, tenemos 


а е1 h2 FOE) 
Far =2hf( + )—2/ 0л) + /( п-ов E 
n x)dx af (xı 3172 Xo X1 X2 12 2 60 1 


h hî 
= ¿1f60) НАРО) + f) т> 


1 1 
=p) _ 7 „(4 
12 al (82) 57 él. 


Con métodos alternos se puede mostrar (consulte el ejercicio 26) que los valores £; y & en 
esta expresión se pueden reemplazar mediante un valor común & en (хо, x2). Esto da la regla 
de Simpson. 


Regla de Simpson: 


`*2 h h5 a) 
/ Fx) dx = 51700) +4/ бл) + f) — 90) ($5). 
xo 


El término de error en la regla de Simpson implica la cuarta derivada de f, por lo que da 
resultados exactos cuando se aplica a cualquier polinomio de grado tres o menos. 


Compare las aproximaciones de la regla trapezoidal y de la regla de Simpson para F f(x)dx 
cuando f(x) es 


а) 1? bx! с) 


d) yvl+x2 е) 


Solución Еп [0, 2], las reglas trapezoidal у de Simpson tiene las formas 


(х +1)! 
sen x D e 


2 
Trapezoidal: / Јо) аха fFOJ+ FO) y 
0 


[/00)+4/@)+ FD]. 


2 
1 
De Simpson: / Р(х) ах ғ 3 
0 


Cuando f(x) = x?, obtenemos 
2 
Trapezoidal: / Рох) ах #0°++2%°=4 y 
0 


| в 1, „оо 8 
De Simpson: Хб) ах ~ ¿1(094+4-1 +21=„: 
0 


La aproximación a partir de la regla de Simpson es exacta porque su error de truncamiento 
implica f®, lo cual es idénticamente 0 cuando f(x) = х2. 

Los resultados a los tres lugares para las funciones se resumen en la tabla 4.7. Observe 
que en cada instancia, la regla de Simpson es significativamente superior. п 
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Tabla 4.7 


Definición 4.1 


La precisión mejorada de la 
regla de Simpson sobre la regla 
trapezoidal se explica de manera 
intuitiva con el hecho de que la 
regla de Simpson incluye una 
evaluación de punto medio que 
proporciona mejor equilibrio 
para la aproximación. 


La terminología abierta y cerrada 
para los métodos implica que el 
método abierto sólo utiliza como 
nodos los puntos en el intervalo 
abierto (a, b) para aproximar 

[| f(x)dx. Los métodos 
cerrados incluyen los puntos a 

y b del intervalo cerrado [a, b] 
como nodos. 


Figura 4.5 


= Diferenciación numérica e integración 


(a) (b) (c) (d) (e) (£) 
fœ) x? xt (х +1)! М1 +x? sen x е* 
Valor exacto 2.667 6.400 1.099 2.958 1.416 6.389 
Trapezoidal 4.000 16.000 1.333 3.326 0.909 8.389 
De Simpson 2.667 6.667 1.111 2.964 1.425 6.421 


Precisión de medición 


Las derivadas estándar de las fórmulas de error de cuadratura están basadas al determinar la 
clase de polinomios para los que estas fórmulas producen resultados exactos. La siguiente 
definición se utiliza para facilitar el análisis de esta derivada. 


El grado de precisión, o precisión, de una fórmula de cuadratura es el mayor entero positivo п, 
de tal forma que la fórmula es exacta para х“, рага cada k =0,1,...,n. 


La definición 4.1 implica que las reglas trapezoidal y de Simpson tienen grados de pre- 
cisión uno y tres, respectivamente. 
La integración y la sumatoria son operaciones lineales; es decir, 


b b b 
го) +880) =a | го)ах+в | 8(х) ах 


У afa) + 8в(х)) == У) + ВУ ga), 


і=0 1=0 i=0 


para cada par de funciones integrables f y g y cada раг de constantes reales œ y В. Esto 
implica (consulte el ejercicio 25) que 


e el grado de precisión de una fórmula de cuadratura es п si y sólo si el error es cero para 
todos los polinomios de grado k = 0, 1,... ‚п, pero no es cero para algunos polinomios 
de grado n + 1. 


Las reglas trapezoidal y de Simpson son ejemplos de una clase de métodos conocidos como 
fórmulas de Newton-Cotes. Existen dos tipos de fórmulas de Newton-Cotes: abiertas y ce- 
rradas. 


Fórmulas de Newton-Cotes cerradas 


La fórmula cerrada de (n + 1) puntos de Newton-Cotes utiliza nodos x; = хо+ій, para 
¡=0,1,...,n, donde xy = а, х, = b y h = (b — а)/п. (Véase la figura 4.5.) Recibe el 


nombre de cerrada porque los extremos del intervalo cerrado [a, b] se incluyen como nodos. 


Teorema 4.2 


Roger Cotes (1682-1716) 
ascendió desde un origen 
humilde hasta convertirse, en 
1704, en el primer profesor 
plumiano en la Universidad 
de Cambridge. Realizó 
numerosos avances en las áreas 
de matemáticas, incluyendo 
los métodos numéricos para 
la interpolación e integración. 
Newton es famoso por decir 
respecto a Cotes: “Si hubiera 
vivido, habríamos aprendido 
algo”. 
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La fórmula asume la forma 


n 


| Fœ dx = Y aj f(x), 


i=0 
donde 


za 


= 


Xn 
а; = JE 
хо 


El siguiente teorema detalla el análisis de error relacionado con las fórmulas de 
Newton-Cotes cerradas. Para una demostración de este teorema, consulte [IK], p. 313. 


пое = |" 


0 j=0 
JA 


Suponga que У)” уа; f (x;) denota la fórmula cerrada de (n + 1) puntos de Newton-Cotes 
con xy = а, Xn =b,yh= b-—a)/n.Existe £ є (a, b) para el que 


"+З A (E) 


f Fx) a aso PEE [га -0--0-та, 
si nes par y f e C"*la, b], y 
Pro х= Parr ELO | 10 De (Em а, 
А 2. 
si п es impar y f e С"+[а, b]. | 


Observe que cuando n es un entero par, el grado de precisión es n + 1, a pesar de que el 
polinomio de interpolación es de grado a lo sumo n. Cuando n es impar, el grado de precisión 
sólo es n. 

Se listan algunas de las fórmulas comunes de Newton-Cotes cerradas con sus términos 
de error. Observe que, en cada caso, el valor desconocido ё se encuentra en (a, b). 


n = 1: Regla trapezoidal 
“i h ha iy 
/ Jœ) dx = [/0%)+ F001=7,P E) donde xo<§ <x. (4.25) 
х0 


п = 2: Regla de Simpson 


х2 h h? 
/ Ро) ах = ¿[£00) +4/ 0а) + F()1— ЫС donde xo <& <. 
х0 (4.26) 
п = 3: Regla de tres octavos de Simpson 
3h? 
J Ро) х = TEF) +3/ба) 4370) + fa) 5 — SOE), (427 


donde xo < E < x3. 
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п = 4: 


+4 2h 8h? 
| Ро) ах = 22 ПО) + 32700) + 12f (22) + 327 з) +7. (x4)] — рд Ok 
х0 


donde хо < < x4. (4.28) 


Fórmulas de Newton-Cotes abiertas 


Las fórmulas de Newton-Cotes abiertas no incluyen los extremos de [a, b] como nodos. Éstas 
utilizan los nodos x; = хо + ih, рага cada i = 0, 1,..., п, donde Л = (b — a)/(n +2) y 
хо = a + h. Esto implica que х, = b — h, por lo que etiquetamos los extremos al estable- 
cer x_¡ = а y хп = b, como se muestra en la figura 4.6. Las fórmulas abiertas contienen 
todos los nodos que se usan para la aproximación dentro del intervalo abierto (a, b). Las 
fórmulas se convertirán en 


b Xn+1 n 
f| леда f" rodar ata, 
ш 1 i=0 


b 
donde а = | Li(x)dx. 


Figura 4.6 


El siguiente teorema es análogo al teorema 4.2; su demostración se encuentra en [IK], 
p. 314. 


Teorema 43 Suponga que У)” уа; f (x;) denota la fórmula abierta de (n + 1) puntos de Newton-Cotes 
con ху = а, хи = b, y h = (b — а)/(п + 2). Existe ё € (a, b) para el que 


n+3 f(n+2) 
Pros Parr O nu |" О О 
—1 


Ejemplo 2 
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si nes par y f є C"*la, b], y 


п pr (n+1) п+1 
Proa-Paror ТӘ їр 6-а) de, 
1—0 $ —1 
si nes impar y f є С" (а, b]. и 


Observe que, сото en el caso de métodos cerrados, tenemos el grado de precisión com- 
parativamente superior para los métodos pares que para los métodos impares. 

Algunas de las fórmulas de Newton-Cotes abiertas comunes con sus términos de error 
son las siguientes: 


п = 0: regla del punto medio 


xX 3 
/ i РО) dx =2hf (xo) + E rO, donde xı <£ < xı. (4.29) 


22 3h ЗАЗ 
f Fx) dx = z 1) + f(x1)]+ a? (8), donde ху <& < хә. (4.30) 
X=Í 


n=2 
Г f(x) ах = 2/60 = 01) +200) + LE og, (4.31) 
donde ху < Ẹ < x3. 
n=3: 
a f(x) ах = = SGo) + Роп) + FADHILA] А? Р (8), (4.32) 


donde ху < ё < x4. 


Compare los resultados de las fórmulas cerradas y abiertas de Newton-Cotes como la ecua- 
ción (4.25) a la (4.28) y la ecuación (4.29) a la (4.32) para aproximar 


л/4 
/ sen x dx = 1 — СМ2/2 = 0.29289322. 
0 


Solución Рага las fórmulas cerradas, tenemos 


n= Г [епо + sen =] де 0.27768018 
ууф [seno + 4sen = + sen =] ~ 0.29293264 
3 ала y 0 + 3зеп — + 3веп > + z] 0.29291070 
= en sen — sen — sen — | 22 О. 
n 8 dal тк a 
a O va a as da 0.29289318 
= $ sen — sen — sen — S РЕД — | А (О. 
da 45 eag “а en % “д 
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Tabla 4.8 


y para las fórmulas abiertas, tenemos 


п=0: 2(2/8) [sen 4) ду 0.30055887 


3(1/12) г л л 
п=1: sen Z + sen =.) ~ 0.29798754 
2 ы 12 6 
4(7/16) | л л 3л 
=2: ———— |2sen — — sen — + 2 ѕеп — | ~ 0.29285866 
" 3 [T T6 87 16 
з: 209/20) AA a К 
n= —— sen sen sen sen — | %0. 
24 | 20 10 20 5 
La tabla 4.8 resume los resultados y muestra los errores de aproximación. п 
п 0 1 2 3 4 
Fórmulas cerradas 0.27768018 0.29293264 0.29291070 0.29289318 
Error 0.01521303 0.00003942 0.00001748 0.00000004 
Fórmulas abiertas 0.30055887 0.29798754 0.29285866 0.29286923 
Error 0.00766565 0.00509432 0.00003456 0.00002399 


La sección Conjunto de ejercicios 4.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


A] 4.4 Integración numérica compuesta 


A menudo, la aproximación por 
tramos es efectiva. Recuerde que 
esto se usó para interpolación de 
spline. 


Ejemplo 1 


En general, el uso de fórmulas de Newton-Cotes es inapropiado sobre largos intervalos de in- 
tegración. Se requerirían fórmulas de grado superior y los valores de los coeficientes en estas 
fórmulas son difíciles de obtener. Además, las fórmulas de Newton-Cotes están basadas en 
los polinomios de interpolación que utilizan nodos igualmente espaciados, un procedimiento 
inapropiado sobre intervalos largos debido a la naturaleza oscilatoria de los polinomios de 
orden superior. 

En esta sección, analizamos el enfoque por tramos (o fragmentario) para la integración 
numérica que usa las fórmulas de Newton-Cotes de bajo orden. Estas son las técnicas que se 
aplican más a menudo. 


Use la regla de Simpson para aproximar Te e* dx y compare esto con los resultados obteni- 
dos mediante la suma, de las aproximaciones de Simpson para de e* dx y А ех dx y al sumar 
éstas con fa e* dx al e* dx, |; e* dx E e* dx. 


Solución La regla de Simpson en [0, 4] con Л = 2 da 
i 2 
/ e dx ж e + 4e? + et) = 56.76958. 
0 


La respuesta correcta en este caso es ef — e? = 53.59815, y el error —3.17143 es mucho 
más grande de lo que aceptaríamos normalmente. 
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Al aplicar la regla de Simpson en cada uno de los intervalos [0, 2] y [2, 4] con h = 1 da 


El error se ha reducido a —0.26570. 


Para las aa en [0, 1], [1, 2], [3, 4], y [3, 4], utilizamos la regla de Simpson cuatro 
veces con Л = >, con lo que obtenemos 


4 1 2 3 4 
ОУ МУ ије 
0 0 1 2 3 


= (eo + 4е'? + е) + н (e +47 +e’) 


Ol = 


+= (е +4? + e) + ° (е + 4е7/2 + е*) 


1 

6 
1 

= ¿(044000 + 2e 440 + 2e? 440% 4 209 440% +e) 

= 53.61622. 


El error para esta aproximación se ha reducido a — 0.01807. п 
Para generalizar este procedimiento para una integral arbitraria ү f(x)dx, seleccione 
un entero par п. Subdivida el intervalo [a, b] en п subintervalos y aplique la regla de Simpson 


en cada par consecutivo de subintervalos (véase la figura 4.7). 


Figura 4.7 


Maja Xj-1 Xj 


Con Л = (b — a)/n y х; =a + jh, para cada j = 0, 1,... ,n, tenemos 


n/2 


f roa f, | уб)ах 


= Х2]—2 


n/2 


= [Р (0-2) + 4/(хәу—1) + Р()] 1-79) з. 
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Teorema 4.4 


: 4 Р 

para algunos &; con хәу—2 < Ẹj < х2, Siempre que f € С [а, b]. A través del hecho de 
que para cada j =1,2,...,(n/2)— 1 tenemos f(x2;) que figura en el término corres- 
pondiente al intervalo [x>;-2,x2;] у también en el término correspondiente al intervalo 
[x2;, x2 +2], podemos reducir esta suma a 


(п/2)—1 n/2 5 n/2 


? h 
К а= 1 Гоо) +2 Y, оо) +4 озу) t fan) |- ә 70). 


Jal j=1 j=1 
El error relacionado con esta aproximación es 


ys n/2 


E(f) = 02,760, 


donde х; 2 < $; < x2;, para cada j = 1, 2,... ,п/2. 
Si f є C*[a, Б], el teorema de valor extremo 1.9 implica que f® asume su máximo y su 
mínimo en [a, b]. Puesto que 


mín теа < PE) < máx, FU, 


xela,b 


tenemos 
n al? n 
5 mín SO) = >, FUE) = 7 máx SO 
y 
E 
mín fO) < 1577965. p< máx fOQ). 


Por medio del teorema de valor intermedio 1.11, existe u € (a, b) tal que 


2 n/2 
OWA ҒӘ). 
j=1 
Por lo tanto, 
К. n/2 
EN = – 0) PEN = ре) 
z 1 
Y, puesto que Л = (b —a)/n, 
EUJS = а) меи), 


Estas observaciones producen el siguiente resultado. 


Si f e С[а, Б], n es par, h = (Б – а)/п, y xj =a + jh, para cada j = 0, 1,..., n. Exis- 
te u € (a, b) para los que la regla compuesta de Simpson рага n subintervalos se puede 
reescribir con su término de error como 


b h (п/2)—1 n/2 b=ä PE 
f Ро) ах = = |f@+2 2, Faj) P DETOJ- LO. 


Figura 4.8 
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Observe que el término de error para la regla compuesta de Simpson es O(h?), mientras 
que era O(h) para la regla estándar de Simpson. Sin embargo, estos índices no son compara- 
bles ya que para la regla estándar de Simpson, tenemos л fija en л = (b — a)/2, pero para la 
regla compuesta de Simpson, tenemos h = (b—a)/n, para n un entero par. Esto nos permite 
reducir considerablemente el valor de h. 

El algoritmo 4.1 utiliza la regla compuesta de Simpson en n subintervalos. Éste es el 
algoritmo de cuadratura que se usa con mayor frecuencia para propósito general. 


Regla compuesta de Simpson 


Para aproximar la integral / = L f(x)dx: 
ENTRADA extremos a, b; entero positivo n par. 
SALIDA aproximación X I para /. 

Paso 1 Haga h = (b—a)/n. 


Paso 2 Haga ХІО = f(a)+ f(b); 
XII = 0; (Suma def (x2;-1).) 
ХІ2 = 0. (Suma de f (хо). 


Paso 3 Parai = 1,... ,n – 1 realice los pasos 4 y 5. 
Paso 4 HagaX =a +ih. 


Paso 5 Si і еѕ раг entonces haga XI2 = ХІ2 + f(X) 
También determine Х/І = XI1+ f(X). 


Paso 6 Нара ХІ =h(XI0+2-X12+4-X11)/3. 


Paso 7 SALIDA (XI); 
PARE. и 


El enfoque de subdivisión se puede aplicar a cualquiera de las fórmulas de Newton- 
Cotes. Las extensiones de las reglas trapezoidal (véase la figura 4.8) y de punto medio se dan 
sin prueba. La regla trapezoidal sólo requiere un intervalo para cada aplicación, por lo que el 
entero n puede ser tanto par como impar. 
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Teorema 45 Sean f є C?[a,b],h = (b —a)/n,y xj =a + јһ, para cada j =0,1,...,n. Existe u € 
(a, b) para el que la regla compuesta trapezoidal para n subintervalos se puede reescribir 
con este término de error como 


n—1 


h b— P 
Proa! /@ +? у «+ /® - у m 


Para la regla compuesta de punto medio, n debe ser, nuevamente, par (véase la figura 
4.9.) 


Figura 4.9 


| | 
T Т 
Xaj=1Xgj Xy+ Жл D=x 


Teorema 46 Si f e C?[a,b], n es par, h = (b — a)/(n + 2), y xj = а + (j+ 1)h para cada j = 
—1,0,... ,n + 1. Existe u € (a, b) para el que la regla compuesta de punto medio para n + 2 
subintervalos se puede reescribir con su término de error como 


n/2 


f Ро) dx =2 > fj) + = ў = 


j=0 


Ejemplo 2 Determine valores de Л que garantizarán un error de aproximación menor que 0.00002 al 
aproximar na sen x dx y usar 
a) La regla compuesta trapezoidal y b) la regla compuesta de Simpson. 


Solución a) La forma de error para la regla trapezoidal compuesta para f(x) = sen х en [0, л] 
es 


т? | h2 
ЕТЕД. |= E ЕЕЕ =z en y. 


Para garantizar suficiente precisión con esta técnica, necesitamos tener 


h? h? 
"о sen u| < => < 0.00002. 


Puesto que Л = x /n, necesitamos 


3 


7 3 
12n2 


л 
12(0.00002) 


1/2 
< 0.00002, lo cual implica que n > ( ) Ат 359.44, 


Se espera que la integración 
numérica sea estable, mientras 
que la diferenciación numérica es 
inestable. 
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y la regla compuesta trapezoidal requiere n > 360. 
b) La forma de error рага la regla compuesta de Simpson para f (х) = sen х en [0, л] es 


|- лћ* 


/®‹и |= Bisen y ТЕ! ел Ml 


= 180 180 


Para garantizar suficiente precisión con esta técnica, necesitamos tener 


ш <= 0.0002. 
т senp < 180 © 


A través del hecho de que n = 7 /h nos da 


5 


ы | | w 1/4 
18014 < 0.00002, lo cual implica que n > | —— = 17.07. 
n 


180(0.00002) 


Por lo tanto, la regla compuesta de Simpson sólo requiere n > 18. 
La regla compuesta de Simpson соп n = 18 nos da 


j 2j—1 
[ szasa 3 (5) e (2) = 2.0000104. 


Esto es preciso dentro de aproximadamente 1075 porque el valor verdadero es — соѕ(л) — 
(— cos(0)) = 2. ш 


La regla compuesta de Simpson es la selección clara si desea minimizar los cálculos. 
Para propósitos de comparación, considere la regla compuesta trapezoidal por medio de 
h = 1/18 para la integral en el ejemplo 2. Esta aproximación utiliza las mismas evalua- 
ciones de función que la regla compuesta de Simpson, pero la aproximación en este caso, 


л 17 А 17 | 
/ senx dx ~ 5- 0 (1) +seno ал = = 5 (2) 
= 1.9949205, 


sólo es precisa para aproximadamente 5 X 107°. 


Estabilidad del error de redondeo 


En el ejemplo 2, observamos que garantizar una precisión de 2 X 107° para aproximar 
de sen x dx requería 360 subdivisiones de [0, л] para la regla compuesta trapezoidal y sólo 18 
para la regla compuesta de Simpson. Además del hecho de que se necesitan menos cálcu- 
los para la técnica de Simpson, usted podría sospechar que este método también implica 
menos error de redondeo. Sin embargo, una propiedad importante compartida por todas 
las técnicas de integración compuesta es una estabilidad respecto al error de redondeo. 
Es decir, el error de redondeo no depende del número cálculos realizados. 

Para demostrar este hecho considerablemente sorprendente, suponga que aplicamos la 
regla compuesta de Simpson con n subintervalos a una función f en [a, b] y determine 
la máxima cota para el error de redondeo. Suponga que f(x;) se aproxima mediante FG) 


y que 


Ро) = f(x) +e; paracadai=0,1,...,n, 
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donde e; denota el error de redondeo asociado con el uso de Í (х;) para aproximar f (x;). 
Entonces, el error acumulado, e(h), en la regla compuesta de Simpson es 


h (п/2)—1 n/2 
e(h) = 3 eo +2 2, кк шры 


h (п/2)—1 п/2 
< = |1601+2 2 эке аны 


Si los errores de redondeo están limitados de manera uniforme por e, entonces 


ПЕН 2(5 1) 4(5) | = 3 =й 
e ЕЗ є + 2 є + 2 E+E =з ne = nne. 


Sin embargo, nh = b — a, por lo que 
e(h) < (b — a)e, 


una cota independiente de h (y n). Esto significa que, aunque quizá necesitemos dividir un 
intervalo en más partes para garantizar precisión, el cálculo incrementado que se requiere 
no aumenta el error de redondeo. Este resultado implica que el procedimiento es estable 
conforme h se aproxima a cero. Recuerde que esto no es verdad para los procedimientos de 
diferenciación numérica considerados al principio de este capítulo. 


La sección Conjunto de ejercicios 4.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


ж 4.5 Integración de Romberg 


En esta sección ilustraremos la forma en la que la extrapolación de Richardson aplicada a los 
resultados de la regla compuesta trapezoidal se puede usar para obtener aproximaciones de 
alta precisión con poco costo computacional. 

En la sección 4.4 encontramos que la regla compuesta trapezoidal tiene un error de trun- 
camiento de orden O(h?). En específico, mostramos que para h = (b — a)/n y x ¡=a+jh, 
tenemos 


| h S 6-0 
/ Ро) dx = > | Раа) „з HO = — A, 


para algún numero џ en (а, b). 
Con un método alternativo, se puede mostrar (consulte [RR], pp. 136-140) que si 


f e C™[a, b], la regla compuesta trapezoidal también se puede escribir con un término de 
error de la forma 


п—1 


b [| 
/ Рб) dx = 5 /@ +2 fafo) + К\А? + Koht + K3hf +- , 
а j=1 (4.33) 


donde К; es una constante que depende solamente de f 01-10 (а) у 01—10 (р). 


Werner Romberg (1909-2093) 
concibió este procedimiento para 
mejorar la precisión de la regla 
trapezoidal al eliminar términos 
sucesivos en la expansión 
asintótica en 1955. 


Ejemplo 1 
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Recuerde, de la sección 4.2, que la extrapolación de Richardson se puede realizar en 
cualquier procedimiento de aproximación cuyo error de truncamiento es de la forma 


т—1 


укун + оф), 


j=1 


рага un conjunto de constantes К; y donde Y; < 02 < аз < ··· < Œm. En esa sección reali- 
zamos demostraciones para ilustrar qué tan efectiva es esta técnica cuando el procedimiento 
de aproximación tiene un error de truncamiento sólo con potencias pares de h, es decir, 
cuando el error de truncamiento tiene la forma 


т—1 
Уку”! + O(h”). 


j=l 


Puesto que la regla trapezoidal compuesta tiene esta forma, es un candidato obvio para extra- 
polación. Esto resulta en una técnica conocida como integración de Romberg. 

Para aproximar la integral f, ? f(x)dx, utilizamos los resultados de la regla compues- 
ta trapezoidal con n = 1,2,4,8,16,..., e indicamos las aproximaciones resultantes, res- 
pectivamente mediante А, А, R3 1, y así sucesivamente. A continuación, aplicamos la 
extrapolación de la forma determinada en la sección 4.2; es decir, obtenemos O(h) aproxi- 
maciones R22, R32, R42, y así sucesivamente, por medio de 


1 
Кро = Кк + 30861 = Ri-11), parak=2,3,... 
y, entonces, las О(А®) aproximaciones Аз з, R4 3, А53, se pueden obtener mediante 
1 
Куз = Күз + 15462 —=Ri-12) para k = 3,4,... 


En general, después de que se han obtenido las aproximaciones Rx, j—ı adecuadas, determi- 
namos las aproximaciones O (427) a partir de 


1 o 
Rz, j = Кул + pog = Rx-1,j-1), parak = j, ј + 1,... 


4j-1 
Use la regla compuesta trapezoidal para encontrar aproximaciones para | sen х dx соп 
п = 1, 2,4, 8 y 16. A continuación, realice la integración de Romberg en los resultados. 


La regla compuesta trapezoidal para los diferentes valores de n proporciona las siguientes 
aproximaciones para el valor verdadero 2: 


Ria = 5 [sen0 + ѕепл] = 0, 
л л 
Ка = 2 [seno +2sen Z + sen z| = 1.57079633, 
л л л 3л 
R31 = — [sen0 +2 | sen — + зеп — + sen + sen л | = 1.89611890, 
8 4 2 4 
R л [ 4-8 л sl л ЕЖЕ" Зл mn 7л а 
= — |sen sen — + sen — +- -- + sen — + sen — sen л 
41 = тє | е е $ e 4 e 4 e $ e 


=1.97423160, y 
л 
32 
= 1.99357034. 


R51 = 


Г 0+2 e e di а 15л PA 
sen sen — + sen — + -- - + sen — + sen —— sen 
ш е 16 e Т е е 16 enm 
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Las aproximaciones O(h%) son 
1 
R22 = R21 + 3 (Кл — Ку) = 2.09439511, 
1 
R32 = R31 + 30831 — R> 1) = 2.00455976, 
1 
R42 = R41 + з Кы! — R31) = 2.00026917, y 
1 
R52 = R51 + 3081 — Ra 1) = 2.00001659. 
Гаѕ аргохітасіопеѕ O(h6) son 
1 
Кзз = R32 + 35 ®з2 — R22) = 1.99857073, 
1 
Кдз = R42 + 15442 = Кз 2) = 1.99998313, y 
1 
К5з = К52 + 15052 — R42) = 1.99999975. 
Las dos aproximaciones O(h?) son 
1 1 
Raa = Каз + Rss = R33) = 2.00000555 y Ад = Кз + з Кэз — Каз) 
= 2.00000001, 
у la aproximación O(h!®) final es 
1 
Rs 5 = Rs 4 + — (R54 = R4 4) = 1.99999999. 
' 255 | 
Estos resultados se muestran en la tabla 4.9. 
Tabla 4.9 |, 
1.57079633 2.09439511 
1.89611890 2.00455976 1.99857073 
1.97423160 2.00026917 1.99998313 2.00000555 
1.99357034 2.00001659 1.99999975 2.00000001 1.99999999 


Observe que al generar las aproximaciones para la regla compuesta trapezoidal en el 
ejemplo 1, cada aproximación consecutiva incluía todas las evaluaciones de la función des- 
de la aproximación previa. Es decir, Ry ¡ utilizaba evaluaciones en O y л, y А usaba estas 
evaluaciones y añadía una evaluación en el punto intermedio 7/2. Entonces R31 utilizaba 
las evaluaciones de А у y añadía dos intermedios adicionales en 7/4 y 37/4. Este patrón 
continúa con Ка | mediante las mismas evaluaciones como R31, pero al añadir evaluaciones 


en los cuatro puntos intermedios л /8, 37/8, 5л /8, 7л /8, y así sucesivamente. 


Este procedimiento de evaluación para las aproximaciones de la regla compuesta tra- 
dicional se mantiene para una integral en cualquier intervalo [a, b]. En general, la regla 
compuesta trapezoidal denotaba R;+1 1 utiliza las mismas evaluaciones que Ry |, pero añade 
evaluaciones en los puntos intermedios 272. Рог lo tanto, el cálculo eficiente de estas apro- 


ximaciones puede realizarse de manera recursiva. 


Para obtener las aproximaciones de la regla compuesta trapezoidal para fi Р(х) ах, 


entonces hg = (b – а)/т = (b — а)/2——!. 


b= 
6 5 а уа) + РФ), 


h 
Ri = 9170) + £(b)] = 


Figura 4.10 
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h 
Ra = z Ifa) + f) +2f(a + h)]. 


Al reescribir este resultado para R21, podemos incorporar la aproximación previamente 
determinada А} | 


(b— a) 
4 


b=a 
Rai = ( - ) 


1 
Аа) + Ф) +27 (a+ ) = ii +A f(a + һ›)]. 


De manera similar, podemos escribir 


1 
Кз = 5021 + hol fa + h3) + f(a + 3h3)1), 


y, en general (véase la figura 4.10), tenemos 


9k-2 


1 А 
Кы = 5 |а + У S (a+ Qi Dh) |, (4.34) 


i=1 


para cada k =2,3,... , n. (Consulte los ejercicios 18 y 19.) 


Tabla 4.10 


Entonces, la extrapolación se usa para producir aproximaciones O (А2) ) mediante 


1 o. 
Кру = Reja + poi Lg E- = Кұ1,3-1), parak=j ј +1,..., 


4 


сото se muestra en la tabla 4.10. 


ko OR) Oh) о(%) O(h) O (h?) 
1 Ку 

2 К | R22 

3 R3, Ез R33 

4 ; 


п Ra Кл? Кз Rn,4 кең Кз 
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Ejemplo 2 


Tabla 4.11 


El método efectivo para construir la tabla de Romberg utiliza el orden más alto de la 
aproximación en cada paso. Es decir, calcula las entradas fila por fila, en orden А} |, А у, R212, 
R31, R32, R33, y así sucesivamente. Esto también permite calcular una nueva fila completa 
en la tabla al realizar sólo una aplicación adicional de la regla compuesta trapezoidal. A con- 
tinuación, usa un promediado simple de los valores previamente calculados para obtener las 
entradas restantes en la fila. Recuerde 


e Calcular la tabla de Romberg una fila completa a la vez. 


Añada una fila de extrapolación adicional a la tabla 4.9 para i sen x dx. 


Solución Para obtener la fila adicional, necesitamos la aproximación trapezoidal 


24 
1 л (2k — 1)л 
Ву =- |В 2 > | = 1.99839336. 
61=> sa 16 2. sen 32 


El valor en la tabla 4.9 da 


1 1 
Кєз = Кл + (Кєл — Ёз) = 1.99839336 +  (1.99839336 — 1.99357035) 
= 2.00000103, 
1 1 
Ros = Кез + те (Көз — Rs,2) = 2.00000103 + ¿ (200000103 — 2.00001659) 


= 2.00000000, 


1 1 
Код = Кєз + 63 (Коз — А53) = 2.00000000, А5 = R6,4 + 255464 = R54) 


= 2.00000000, 


у Кєє = Rós + w (R6,s — Rs,5) = 2.00000000. La nueva tabla de extrapolación se mues- 
tra en la tabla 4.11. п 


0 

1.57079633 2.09439511 

1.89611890 2.00455976 1.99857073 

1.97423160 2.00026917 1.99998313 200000555 

1.99357034 2.00001659 1.99999975 200000001 1.99999999 

1.99839336 2.00000103 2.00000000 2.00000000 2.00000000 2.00000000 


Observe que todos los valores extrapolados excepto por el primero (en la primera fila de 
la segunda columna) son más precisos que la mejor aproximación compuesta trapezoidal (en la 
última fila de la primera columna). A pesar de que existen 21 entradas en la tabla 4.11, sólo 
la sexta en la columna izquierda requiere evaluaciones de función ya que son las únicas en- 
tradas generadas por la regla compuesta trapezoidal; las otras entradas se obtienen mediante 
un proceso de promediado. De hecho, debido a la relación de recurrencia de los términos 
en la columna izquierda, las únicas evaluaciones de función son aquellas para calcular la 
aproximación de la regla compuesta trapezoidal. En general, Ry | requiere evaluaciones de 
función 1 + 2—!, por lo que en este caso se necesita 1 + 25 = 33. 


El adjetivo cauteloso que se usa 
en la descripción de un método 
numérico indica que se incluye 
una verificación para determinar 
si las hipótesis de continuidad 
tienen alguna probabilidad de ser 
verdaderas. 
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El algoritmo 4.2 usa el procedimiento recursivo para encontrar las aproximaciones de la 
regla compuesta trapezoidal y calcula los resultados en la tabla fila por fila. 


Integración de Romberg 


b 
Para aproximar la integral / = / f(x)dx, seleccione un entero n > 0. 
a 


ENTRADA extremos a, b; entero n. 
SALIDA un arreglo R. (Calcule R por filas; sólo se almacenan las últimas dos filas.) 


Paso 1 Haga h=b-a; 
Кул = ¿(f (a) + /@)). 
Paso 2 SALIDA (Ri 1). 


Paso 3 Рага і = 2,... ,n realice los pasos 4—8. 
1—2 
1 
Paso 4 Нава № = > |. +h XO fa + (к – 0.5)һ) |. 
k=1 


(Aproximación a partir del método trapezoidal.) 


Paso 5 Paraj =2,...,i 


R ул — Rı,j-1 


haga К ; = Рр + — (Extrapolación.) 


Paso 6 SALIDA (R, ;рагај = 1, 2,..., і). 

Paso 7 Hagah = h/2. 

Paso 8 Рага] = 1, 2,...,і determine А; = Ру. (Actualice la fila 1 de К.) 
Раѕо 9 РАКЕ. ш 


El algoritmo 4.2 requiere un entero preestablecido п para determinar el número de 
filas que se va a generar. También estableceremos una tolerancia de error para la aproxi- 
mación y generar n, dentro de algúna cota superior hasta que las entradas diagonales con- 
secutivas R»-1.1-1 Y Rn,n concuerden dentro de la tolerancia. Para evitar la posibilidad de 
que dos elementos de fila consecutivos concuerden unos con otros, pero no con el valor de 
la integral que se está aproximando, es común generar aproximaciones hasta que no sólo 
IR»-1.n-1 = Rn.n] esté dentro de la tolerancia, sino también |R,-2 1-2 — Rn-1.n-1|. A pesar 
de que no es una protección universal, esto garantizará que dos conjuntos de aproximaciones 
generados de manera diferente concuerden dentro de la tolerancia especificada antes de Ёл 
se acepte como suficientemente preciso. 

La integración de Romberg aplicada a una función fen el intervalo [a, b] depende de la 
suposición de que la regla compuesta trapezoidal tienen un término de error que se puede 
expresar en la forma de la ecuación (4.33); es decir, debemos tener f € С? [а,Ь] рага 1а 
k-ésima fila que se va a generar. Los algoritmos de propósito general por medio de la inte- 
gración de Romberg incluyen una verificación en cada etapa para garantizar el cumplimiento 
de esta suposición. Estos métodos se conocen como algoritmos cautelosos de Romberg y 
se describen en [Joh]. Esta referencia también describe métodos para utilizar la técnica de 
Romberg como un procedimiento adaptable, similar a la regla adaptable de Simpson, la cual 
se analizará en la sección 4.6. 


La sección Conjunto de ejercicios 4.5 está disponible en línea. Encuentre la ruta de 
acceso en páginas preliminares. 
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WI 4.6 Métodos de cuadratura adaptable 


Ilustración 


Figura 4.11 


Las fórmulas compuestas son muy efectivas en muchas situaciones, pero ocasionalmente su- 
fren porque requieren el uso de nodos igualmente espaciados. Esto es inadecuado al integrar 
una función sobre un intervalo que contiene ambas regiones con gran variación funcional y 
regiones con variación funcional pequeña. 


La única solución a la ecuación diferencial y” + бу! + 25 = 0 que adicionalmente satis- 
face y(0) = 0 y y'(0) = 4 es у(х) = ех sen 4х. Las funciones de este tipo son comunes 
en ingeniería mecánica porque describen ciertas características de sistemas absorbentes de 
muelle y amortiguador y en ingeniería eléctrica porque son soluciones comunes a los pro- 
blemas fundamentales de circuitos. La gráfica de у(х) para x en el intervalo [0, 4] se muestra 
en la figura 4.11. 


Suponga que necesitamos la integral de у(х) en [0,4]. La gráfica indica que la integral 
en [3, 4] debe estar muy cerca de 0 y en [2, 3] tampoco se esperaría que fuera grande. Sin 
embargo, en [0, 2], existe variación significativa de la función y no es del todo clara cuál es la 
integral en este intervalo. Este es un ejemplo de una situación en donde la integración com- 
puesta sería inadecuada. Se podría usar un método de orden bajo en [2, 4], pero se necesitaría 
un método de orden superior en [0, 2]. E 


La pregunta que consideraríamos en esta sección es: 


e ¿Cómo podemos determinar la técnica que deberíamos aplicar en las diferentes partes del 
intervalo de integración y qué tan precisa podemos esperar que sea la aproximación final? 


Veremos que en ciertas condiciones razonables, podemos responder esta pregunta y también 
determinar aproximaciones que satisfacen requisitos de precisión determinados. 

Si el error de aproximación para una integral en un intervalo determinado está distri- 
buido de manera equitativa, se necesita un tamaño de paso más pequeño para las grandes 
regiones de variación que para aquellas con menos variación. Una técnica eficiente para este 
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tipo de problema debería predecir la cantidad de variación funcional y adaptar el tamaño de 
paso conforme sea necesario. Estos métodos reciben el nombre de métodos de cuadratura 
adaptable. Los métodos adaptables son especialmente populares para la inclusión en pa- 
quetes profesionales de software porque, además de ser eficientes, en general proporcionan 
aproximaciones que se encuentran dentro de una tolerancia específica determinada. 

En esta sección, consideramos un método de cuadratura y veremos cómo se puede usar 
para reducir el error de aproximación y también predecir un error calculado para la apro- 
ximación que no depende del conocimiento de las derivadas superiores de la función. El 
método que analizamos está basado en la regla compuesta de Simpson, pero la técnica se 
modifica fácilmente para utilizar otros procedimientos compuestos. 

Suponga que queremos aproximar f f(x) ах dentro de una tolerancia específica e > 0. 
El primer paso es aplicar la regla de Simpson con tamaño de paso h = (b — a)/2. Esto pro- 
duce (véase la figura 4.12) 


b 5 
/ f(x)dx = S(a,b) — TO, para algunos & ер (а, b), (4.35) 


donde denotamos la aproximación de la regla de Simpson en [a, b] mediante 


} 
S(a,b) = 31/00) +4/ (а +h) + РФ). 


Figura 4.12 


S(a, b) 


El siguiente paso es determinar una aproximación de precisión que no requiere / (E). 
Para hacerlo aplicamos la regla compuesta de Simpson con n = 4 y el tamaño de paso 
(b—a)/4 = h/2,lo cual nos da 


f h h 3h 
f(x)dx = z soas (4+5) +2f(a+h)+4f (a+) +10) 


4 ==. 
= (3) 6-9 0, (4.36) 


2 180 


para algunos ё en (a, b). Para simplificar la notación, si 


a+b А 4 h n 
s(a 3 )= 0+ /(в+;)+/@+ ] 
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$ а+ь, А } 4 3h Ь 
(2. )= [++ a+) +1 |. 


Entonces, la ecuación (4.36) se puede reescribir (véase la figura 4.13) como 


Р Е a+b a+b LIN z 
| гоа = 5а, 2 )+5( > ») zla) (E). 


Figura 4.13 


(4.37) 


El cálculo de error se deriva al suponer que £ ~ Ẹ o, con mayor precisión, que FW (E) ~ 
fO (@), y el éxito de la técnica depende de la precisión de esta suposición. Si es precisa, 
entonces, al equiparar las integrales en las ecuaciones (4.35) y (4.37) obtenemos 


a+b a+b 1 h5 a) Po А? a 
s(a )+5( ») (5): © 7 а Б) – 10), 


2 2 16 


por lo que 


90 2 2 


Al utilizar esta técnica en la ecuación (4.37) produce el cálculo de error 


р a+b a+b 
| тех s(a 5 ) s( 5 ») 


5 
Ey _ $ (22) $ (2). 


1 (Р? 1 a+b a+b 
x—|— TES b 
z (5) E) ~ те |54, Б) s(a 5 ) s( 5 


Ejemplo 1 
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Esto implica que Sía, (a + b)/2) + Sí(a + b)/2, b) se aproxima a р? f(x) ах aproxima- 
damente 15 veces mejor que lo que concuerda con el valor calculado $(а, b). Por lo tanto, si 


b b 
S(a,b) s(a ) (= .0)| <1 (4.38) 


esperamos tener 


< е, (4.39) 


b 
[юа s(a =) s (472e) 
a+b a+b 
s(a 2 )+s( 2 b) 


AEE E E b 
se supone que es una aproximación suficientemente precisa para S f(x)dx. 


Verifique la precisión del cálculo de error determinado por las desigualdades (4.38) y (4.39) 


al aplicar la integral 
1/2 
/ sen х dx = 1 
0 


al comparar 


15 15(0.5) -5 (0.7) 5 (G 2) eo 


Solución Tenemos 


л/2 л л л 
/ senx dx s (0, ) 5( Р ) 
А 4 42 


s (0 т) 11 0 +4sen 7. >] Л (24/5 4 1) = 1.002279878 
212 53 AA ЕТ + =1. 


5(о т) .5(7 т) л/8 0+4 Tag АА с л 
, — —, — | = — [sen sen — sen — sen — + sen — 
4 з [| Е ЗАНИ Ени 


1.000134585. 


л л л л 
|s (0, ) 5 (0, ) 5 a > ) = |1.002279878 — 1.000134585| = 0.002145293. 


El cálculo para el error obtenido al utilizar S(a, (a+b))+S((a+b), b) para aproximar 
de f(x) dx es, por consiguiente, 


55 [5(0. 5) -s (0.5) 


тл 
5( )| = 0.000143020, 
4'2 
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Es buena idea incluir un margen 
de seguridad cuando es imposible 
verificar las suposiciones de 
precisión. 


el cual se aproxima de cerca al error real 


1/2 
/ sen x dx — 1.000134585| = 0.000134585, 
0 


aunque DŻ sen х = sen x varía significativamente en el intervalo (0, 7/2). ш 


Cuando las aproximaciones еп la desigualdad (4.38) difieren por más de 15є, pode- 
mos aplicar la técnica de la regla de Simpson de manera individual a los subintervalos 
[a, (a+b)/2] y [(a+b)/2,b]. A continuación, usamos el procedimiento de cálculo de 
error para determinar si la aproximación para la integral en cada subintervalo se encuentra 
dentro de una tolerancia de e/2.En este caso, sumamos las aproximaciones para producir 
una aproximación de E f(x) dx dentro de la tolerancia e. 

Si la aproximación en uno de los subintervalos no se encuentra dentro de la tolerancia 
e/2, entonces ese subintervalo se subdivide en sí mismo y el procedimiento se reaplica a los 
dos subintervalos para determinar si la aproximación en cada subintervalo es precisa dentro de 
£/4. Este procedimiento de reducción a la mitad continúa hasta que cada parte está dentro 
de la tolerancia requerida. 

Se pueden construir problemas para los que esta tolerancia nunca se cumplirá, pero 
normalmente la técnica es exitosa porque cada subdivisión aumenta la precisión de la apro- 
ximación en un factor de 16 mientras requiere un factor de precisión aumentado en sólo 2. 

El algoritmo 4.3 describe detalladamente este procedimiento de cuadratura adaptable 
para la regla de Simpson, a pesar de que la implementación difiere ligeramente del análisis 
anterior. Por ejemplo, en el paso 1, la tolerancia se ha establecido en 10e en lugar de en 15e en 
la desigualdad (4.38). Esta cota se elige de manera conservadora para compensar el error 
en la suposición f® (£) ~ f® (E). En problemas donde se sabe que f ® varía ampliamente, 
esta cota debería disminuir todavía más. 

El procedimiento listado en el algoritmo, primero aproxima la integral en el subinter- 
valo situado más a la izquierda en una subdivisión. Esto requiere almacenamiento eficiente 
y recordar las evaluaciones funcionales que se han calculado antes para los nodos en los 
subintervalos situados a la mitad derecha. Los pasos 3, 4 y 5 contienen un procedimiento de 
apilamiento con un indicador para seguir los datos requeridos para calcular la aproximación 
en el subintervalo inmediatamente adyacente y a la derecha del subintervalo en el que se 
genera la aproximación. El método es más fácil de implementar por medio de lenguaje de 
programación recursivo. 


Cuadratura adaptable 


b 
Para aproximar la integral Z = | f(x)dx dentro de una tolerancia determinada: 
a 


ENTRADA extremos а, b; tolerancia TOL; cota М para diferentes niveles. 
SALIDA aproximación APP o mensaje N superado. 
Paso 1 Haga APP = 0; 


і = 1; 

TOL; = 10 TOL; 
а: = а; 

h; = (b — а)/2; 
ЕА; = f(a); 

FC; = f(a + hi); 
FB; = f(b); 


$ = h; (FA; + АЕС; + ЕВ;)/3; (Aproximación a partir del método 
de Simpson para intervalo completo.) 
E; =:1. 


Paso 2 Sii > 0 haga los pasos 3—5. 
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Paso З Нава FD = f(a; + һ;/2); 

FE = f(a; + 3h;/2); 

S1 = р; (ЕА; + АЕР + ЕС;)/6; (Aproximaciones para el método 
de Simpson para mitades de 
subintervalos.) 

52 = А: (ЕС; + 4ЕЕ + ЕВ;)/6; 

vı = а; (Guardar datos en este nivel.) 


v = ЕА; 
13 = ЁС; 
v4 = ЕВ;; 
vs = hi; 
16 = ТОШ; 
v = Si; 
Ug = Li: 


Paso 4 Hagai=i-—1. (Borrar el nivel.) 
Paso 5 81151 + 52 – 05| < 15 
entonces determine APP = APP + (51 + 52) 
también 
si (ug > N) 
entonces 
SALIDA (NIVEL EXCEDIDO”); (Falla del procedimiento.) 
PARE. 
también (Añadir un nivel.) 
haga i =i + 1; (Datos para subintervalo mitad derecha.) 
а = U + 05; 


FA; = v3; 
FC; = FE; 
ЕВ; = Va; 
hi = 05/2; 
TOL; = 0/2; 
Si = 52; 
Li = v + 1; 
haga i =i + 1; (Datos para subintervalo mitad izquierda.) 
a; = YU; 
FA; = v; 
FC; = FD; 
FB; = 13; 
hi = №1; 
TOL; = ТОГ;_1; 
Si = 51; 
Di = Lig 
Paso 6 SALIDA (APP); (APP se aproxima а I dentro de TOL. ) 
PARE. н 


Ilustración La gráfica de la función f(x) = (100/x?) sen(10/x) para x en [1, 3] se muestra en la fi- 
gura 4.13. Por medio del algoritmo de cuadratura adaptable 4.3 con tolerancia 10° para 
aproximar f т f(x)dx produce —1.426014, un resultado preciso dentro de 1.1 х 107. 
La aproximación requería que la regla de Simpson con n = 4 se realice sobre los 23 subin- 
tervalos cuyos extremos se muestran еп el eje horizontal en la figura 4.14. El número total de 
evaluaciones funcionales requerido para esta aproximación es 93. 
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Figura 4.14 


El valor más grande de h para el que la regla compuesta de Simpson estándar provee 
precisión dentro de 1074 es h = 1/88. Esta aplicación requiere 177 evaluaciones de función, 
aproximadamente dos veces más que la cuadratura adaptable. и 


La sección Conjunto de ejercicios 4.6 está disponible en línea: Encuentre la ruta de 
acceso en las páginas preliminares. 


EN í 4.7 Cuadratura gaussiana 


Las fórmulas de Newton-Cotes en la sección 4.3 se dedujeron al integrar polinomios de in- 
terpolación. El término de error en el polinomio interpolante de grado n implica la derivada 
(n + 1) de la función que se va a aproximar, por lo que la fórmula Newton-Cotes es exacta 
al aproximar la integral de cualquier polinomio de grado menor o igual a n. 

Todas las fórmulas de Newton-Cotes utilizan valores de la función en puntos igualmente 
espaciados. Esta restricción es conveniente cuando se combinan las fórmulas para formar las 
reglas compuestas que consideramos en la sección 4.4, pero puede disminuir significativa- 
mente la precisión de la aproximación. Considere, por ejemplo, la regla trapezoidal aplicada 
para determinar las integrales de las funciones cuyas gráficas se muestran en la figura 4.15. 


Figura 4.15 
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Figura 4.16 


La regla trapezoidal aproxima la integral de la función al integrar la función lineal que 
une los extremos de la gráfica de la función. Pero probablemente no es la mejor línea para 
aproximar la integral. En muchos casos, las líneas como las mostradas en la figura 4.16 pro- 
bablemente proporcionarían mucho mejores aproximaciones. 


] 
| 
] 
] 
] 
l 
| 
| 

x 


Gauss demostró su método de 
integración numérica eficiente 
en un documento presentado 
ante la Göttingen Society en 
1814. ÉI permitió que los nodos, 
así como los coeficientes de las 
evaluaciones de función, fueran 
parámetros en la fórmula de 
suma y encontró la colocación 
óptima de los nodos. Goldstine 
[Golds], pp. 224-232, tiene una 
descripción interesante de este 
desarrollo. 


En la cuadratura Gaussiana, los puntos para evaluación se seleccionan de manera óptima 
en lugar de nodos igualmente espaciados. Los nodos х], X2, ... , Xn en el intervalo [a, b], y 
los coeficientes c1, C2, ... , сп ве seleccionan para minimizar el error esperado obtenido en 
la aproximación 


n 


b 
/ Ро) ах = Y cf (xp). 


i=1 


Para medir esta precisión, suponemos que la mejor elección de estos valores produce el 
resultado exacto para la clase de polinomios de mayor grado, es decir, la selección que da 
el grado más alto de precisión. 

Los coeficientes с, Ca, ... 
O ае 


, Сп en la fórmula de aproximación son arbitrarios y los nodos 
, Xn están restringidos solamente por el hecho de que deben encontrarse en [a, b], 
el intervalo de integración. Esto nos da 2n parámetros a elegir. Si los coeficientes de un 
polinomio se consideran parámetros, la clase de polinomios de grado por lo menos 2n — 1 
también contiene 2n parámetros. Esto, entonces, es la mayor clase de polinomios para los 
que es razonable esperar que una fórmula sea exacta. Con la elección adecuada de valores y 
constantes, se puede obtener la precisión en este conjunto. 
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Para ilustrar el procedimiento para elegir los parámetros adecuados, mostraremos cómo 
seleccionar los coeficientes y nodos cuando n = 2 y el intervalo de integración es [—1, 1]. 
Entonces, analizaremos la situación más general para una selección arbitraria de nodos y 
coeficientes y mostraremos cómo se modifica la técnica al integrar sobre un intervalo arbi- 
trario. 

Suponga que queremos determinar сү, сә, х], y хо de tal forma que la fórmula de inte- 
gración 


1 
| Jœ) dx X c f(x1) + ef (хә) 
=i 


da el resultado exacto siempre que f(x) es un polinomio de grado 2(2) — 1 = 3 o menor, es 
decir, cuando 


f(x) = ap + aix + ax? + азх?, 


рага algún conjunto de constantes ао, 41, a2, у аз. Puesto que 
ачах ал? + аз?) ах = а [Е desa fx 4х+а› [arta | хах 


esto es equivalente a mostrar que la fórmula da resultados exactos cuando f(x) es 1, х, х2, y 
хз. Рог lo tanto, necesitamos сі, сә, X1, y хә, de tal forma que 


1 1 
аот | 1dx=2, азаа = | xdx=0, 
=1 -1 


1 2 1 
catre = | хах = =, y ape | х? ах = 0. 
-1 -1 


Un poco de álgebra muestra que este sistema de ecuaciones tiene una solución única 
c=1, Со = 1, == 55, y X= =, 


lo cual da la fórmula de aproximación 


МЕ v3 


1 — 
| todxs = +f 3): (4.40) 


Esta fórmula tiene grado de precisión tres; es decir, produce el resultado exacto para cada 
polinomio de grado tres o menor. 


Polinomios de Legendre 


La técnica que hemos descrito se puede utilizar para determinar los nodos y coeficientes para 
las fórmulas que dan resultados exactos para polinomios de grado superior, pero un método 
alterno los obtiene con mayor facilidad. En las secciones 8.2 y 8.3, consideraremos diferentes 
conjuntos de polinomios ortogonales, funciones que tienen la propiedad de que una integral 
definida del producto de cualquiera de dos de ellas es 0. El conjunto relevante para nuestro 
problema son los polinomios de Legendre, un conjunto { Ро(х), Pp (x),..., Р,(х),...,} 
con las siguientes propiedades: 


(1) Para cada n, Р, (x) es un polinomio mónico de grado л. 


1 
(2) / Р(х)Р, (х) ах = О siempre que Р(х) sea un polinomio de grado menor а n. 
-1 


Recuerde que los polinomios 
mónicos tienen un coeficiente 
principal de 1. 


Adrien-Marie Legendre (1752— 
1833) introdujo este conjunto 

de polinomios en 1785. Tuvo 
numerosas disputas prioritarias 
con Gauss, principalmente 
debido a la falla de Gauss al 
publicar muchos de sus resultados 
originales mucho después de que 
los había descubierto. 


Teorema 4.7 
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Los primeros polinomios de Legendre son 
P, == P 2 1 
0(х) 1, 100) = х, Р(х) = х T7 


Poser = x Вал о 
о з ЫЛЕ Е Г. 

Las raíces de estos polinomios son distintas, se encuentran en el intervalo (— 1, 1), tienen 
una simetría respecto al origen y, más importante, son la elección correcta para determinar 
los parámetros que nos proporcionan los nodos y coeficientes para nuestro método de cua- 
dratura. 

Los nodos x1, X2,... , Xn necesarios para producir una fórmula de aproximación integral 
que proporcione resultados exactos para cualquier polinomio de grado menor a 2n son las 
raíces del polinomio de Legendre de enésimo grado. Esto se establece mediante el siguiente 
resultado. 


Suponga que X1,X2,... , Xn son las raíces del n-ésimo polinomio de Legendre P, (x) y que 
рага сайа і = 1, 2,... ‚п, los números c; están definidos por 
i =) 
с; = ах 
1 ps] Xi — Xj 
JA 


Si Р(х) es cualquier polinomio de grado menor a 2n, entonces 


1 n 


P(x) dx = EP Ci) 
|: (х) dx Ус (х;) 


¡=1 


Demostración Consideramos primero la situación para un polinomio Р(х) de grado menor a n. 
Reescriba P(x) en términos de los polinomios de coeficientes de Lagrange (n — 1)-ésimos 
con nodos en las raíces del n-ésimo polinomio de Legendre Р,„(х). El término de error para 
esta representación implica la n-ésima derivada de P(x). Puesto que P(x) es de grado menor 
ап, la n-ésima derivada de Р(х) es О y esta representación es exacta. Por lo tanto, 


ро) = Уураа) = УрО) 


— x; 
i=l ї=1 ¡=1 J 
JA 


n 


/ it) Y ets 
= X Xi) = Ci Xi). 
я = Xi Х) 


і=1 


Рог lo tanto, el resultado es verdad para polinomios de grado menor а и. 

Ahora considere un polinomio P(x) de grado por lo menos n pero menor a 2n. Divida 
Р(х) entre el n-ésimo polinomio de Legendre P„(x). Esto proporciona dos polinomios Q(x) y 
R(x), cada uno de grado menor a n, con 


P(x) = О(х)Р,(х) + R(x). 
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Observe que x; es una raíz de Р„(х) рага cada i = 1, 2,... , п, por lo que tenemos 


Р(х) = Qi) Pr) + К(х) = R(x;). 


Ahora, recurrimos a la potencia única de los polinomios de Legendre. En primer lugar, el 
grado del polinomio О(х) es menor a п, por lo que (mediante la propiedad (2) de Legendre), 


1 
/ О(х)Р, (х) dx =0. 
-1 


A continuación, puesto que R(x) es un polinomio de grado menor a n, el argumento de aper- 
tura implica que 


n 


1 
R(x) ах = iR i). 
ГА (х) dx Ус (х;) 


i=l 
Al juntar estos hechos, verificamos que la fórmula es exacta para el polinomio P(x): 


n n 


1 1 1 
P(x) dx = Р(х) + К(х)]4ах = | RÆ dx = Y ara) = Y PG). 
| Роза = | лоор.) + колах = | во) ах = ara) = Уер) 


1 1 = i=1 i=1 


Las constantes c; necesarias para la regla de cuadratura se pueden generar a partir de la 
ecuación en el teorema 4.7, pero tanto las constantes como las raíces de los polinomios de 
Legendre se tabulan ampliamente. La tabla 4.12 enumera estos valores para n = 2, 3, 4 y 5. 


n Raíces г, ; Coeficientes с, ; 
2 0.5773502692 1.0000000000 
—0.5773502692 1.0000000000 

3 0.7745966692 0.5555555556 
0.0000000000 0.8888888889 
—0.7745966692 0.5555555556 

4 0.8611363116 0.3478548451 
0.3399810436 0.6521451549 
—0.3399810436 0.6521451549 
—0.8611363116 0.3478548451 

5 0.9061798459 0.2369268850 
0.5384693101 0.4786286705 
0.0000000000 0.5688888889 
—0.5384693101 0.4786286705 
—0.9061798459 0.2369268850 


1 


Aproxime / е* соз х dx mediante cuadratura gaussiana con n = 3. 
=] 


Solución Las entradas en la tabla 4.12 nos dan 


1 
/ е“ cos x dx ~ 0.5е0-77459669 cos ().774596692 
—1 


+ 0.8 cos 0 + 0.570774596692 cos(—0.774596692) 
= 1.9333904. 


La integración por partes se puede utilizar para mostrar que el valor verdadero de la integral 
es 1.9334214, por lo que el error absoluto es menor a 3.2 х 107°. и 
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Cuadratura gaussiana en intervalos arbitrarios 


Una integral f f(x) dx sobre un intervalo arbitrario [a, b] se puede transformar en una 
integral sobre [—1, 1] al utilizar el cambio de variables (véase la figura 4.17): 


2х -а-– Б 1 
t = ——m— te x =-Í[(b- aj +а+һ]. 
р-а 2 


Figura 4.17 


Esto permite aplicar la cuadratura gaussiana a cualquier intervalo [а, b] porque 


b 1 = = 
| гоа | /(° A ES т (4.41) 


2 2 


1 


3 
Ejemplo 2 Considere la integral f xê — х? веп(2х) dx = 317.3442466. 
1 


a) Compare los resultados de la fórmula cerrada de Newton-Cotes con n = 1, la 
fórmula abierta de Newton-Cotes con n = 1, y la cuadratura gaussiana cuando n = 2. 
b) Compare los resultados de la fórmula cerrada de Newton-Cotes con n = 2, la 
fórmula abierta de Newton-Cotes con п = 2, y la cuadratura gaussiana cuando п = 3. 


Solución a) Cada una de las fórmulas en esta parte requiere dos evaluaciones de la función 
то) хб — х? ѕеп(2х). Las aproximaciones de Newton-Cotes son 


Cerrada n=1: > [/@) + F(3)] = 731.6054420; 
. 3(2/3) 
Abierta n=1: 25 [/(5/3) + /(7/3)] = 188.7856682. 


La cuadratura gaussiana aplicada a este problema requiere que la integral primero se trans- 
forme en un problema cuyo intervalo de integración es [—1, 1]. Por medio de la ecuación 
(4.41) obtenemos 


3 1 
/ xê — х? ѕеп(2х) dx = / (@ + 2)% — (т +2)? sen(2(t +2) аг. 
1 =l 
Entonces, la cuadratura con n = 2 da 


3 
/ хб — x? ѕеп(2х) dx = f(-0.5773502692 + 2) + f(0.5773502692 + 2) 
1 


= 306.8199344. 
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b) Cada una de las fórmulas en esta parte requiere tres evaluaciones de función. Las aproxi- 
maciones de Newton-Cotes son 


Cerrada n = 2: Н [/@)+4/(@)-+ /(8)] = 333.2380940; 


Abierta п = 2: La 2fa4.5) – (2) + 27(02.5)] = 303.5912023. 


Га cuadratura gaussiana сор п = 3, una vez que la transformación se ha realizado, obtenemos 


3 
/ x? — х2 sen(2x) dx = 0.5 f(-0.7745966692 + 2) 
1 


+ 0.8 f (2) + 0.5 f(-0.7745966692 + 2) = 317.2641516. 
Los resultados de la cuadratura gaussiana son claramente superiores еп cada instancia. юш 


La sección Conjunto de ejercicios 4.7 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 4.8 Integrales múltiples 


Las técnicas analizadas en las secciones previas se pueden modificar para utilizarse en la 
aproximación de integrales múltiples. Considere la integral doble 


J| ге, »ал, 
R 


cuando R = { (х,у) | а <x <b,c< y < d}, para algunas constantes а, b, c y d, es 
una región rectangular en el plano. (Véase la figura 4.18.) 


Figura 4.18 


z = f(x, y) 


La siguiente ilustración muestra la manera en la que la regla compuesta trapezoidal por 
medio de dos subintervalos en cada dirección coordinada se aplicaría a esta integral. 
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Ilustración Al escribir la integral doble como una integral iterada obtenemos 


ҮЛ. 
J| ге, nar] (/ о. »а›) ах. 
R 


Para simplificar la notación, si k = (d—c)/2y h = (b—a)/2. Aplique la regla compuesta 
trapezoidal a la integral interior para obtener 


a k c+d 
[ tenax 5 |а у, +2/ (х, 7 )|. 


Esta aproximación es de orden О (a = cy) A continuación, aplique la regla compuesta tra- 
pezoidal nuevamente para aproximar la integral de esta función de x: 


(Ге say) а= f (EE) [re 9 +2/ (x +“ „уш J dx 
“шш т Ж Е ' Ж | 
= (175) |гв,о+2/ (a ZE) + ув, 

b=a d=<c a+b a+b c+d a+b 
ОСЕ о laa р 

c+d 

а (2 E) 100427 (6,35) + rea] 

> 290-0 

rar fadt /®,о) + Soad) 
a+b a+b c+d c+d 

m rA (E) ш (669)) 


a+b c+d 
тоо! 


Esta aproximación es de orden О (0 a)(d — с) [0 а)? + (а — cl): La figura 


4.19 muestra una cuadrícula con el número de evaluaciones funcionales en cada uno de los 
nodos utilizados en la aproximación. a 


Figura 4.19 
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Como muestra la ilustración, el procedimiento es bastante sencillo. Sin embargo, el 
número de evaluaciones de función crece con el cuadrado del número requerido para una 
sola integral. En una situación práctica, no esperaríamos utilizar un método tan básico como 
la regla compuesta trapezoidal con n = 2. En cambio, usaremos la regla compuesta de Simp- 
son que es más apropiada para ilustrar la técnica de aproximación general, a pesar de que se 
podría usar cualquier otra fórmula en su lugar. 

Para aplicar la regla compuesta de Simpson, dividimos la región R al subdividir [a, b] 
y [c, d] en un número par de subintervalos. Para simplificar la notación, seleccionamos en- 
teros pares n y m y subdividimos [a, b] y [c, d] con puntos de malla igualmente espaciados 
X0, Х1,... > Xn Y Yo, У1,... > Ym respectivamente. Estas subdivisiones determinan tamaños 
de pasos Л = (b — a)/n y k = (d – с)/ т. Al escribir la integral doble como la integral 


iterada 
b d 
| fæ 4А = | (/ гоо) de 


R 


primero utilizamos la regla compuesta de Simpson para aproximar 


d 
f Р(х, y dy, 


tomando x como una constante. 


Si у; = c + jk, para cada j =0,1,... ‚т. Entonces 
d k (т/2)—1 m/2 
f Ро, ydy = = | Росо) +2 у, fE y) +4) РО, уа) + fE, ум) 
i j=1 j=1 
(d — с) f(x, ш) 
180 ayt 


para algunas u en (c, d). Por lo tanto, 


b d К b 
ff ®»вах= |] URLS 


m/2 b 


b 
+45 f tomar | 6%, 3m) dx 
j=1 a a 


(d — с)к* IN dtf, и) 
dx. 
180 Ja dy* 


(m/2)-1 


b 
© [tampa 
jar Ya 


Ahora, utilizamos la regla compuesta de Simpson para las integrales en esta ecuación. Si 


x; =a + ih, рага cada i =0,1,... , n. Entonces, para cada j =0,1,... ,m tenemos 
b h (п/2)—1 п/2 
/ fæ урах = = [ Ж +2 Y fai у) +4) Роз, уу) + / (хл, уу) 
a ї=1 i=1 
(b — a)ht ðt f 
= (6р 0), 


180 Әх? 
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para algunos ¿;en (a, b). La aproximación resultante tiene la forma 


(n/2)-1 


b pd 
[| | tenoa: | [460.30+2 У? fr, yo) 


i=1 


n/2 
+40 ооа, yo) + / Ом, w) 


i=1 


(m/2)—1 (m/2)—1 (п/2)—1 


+ 5 / (хо, y2j) +2 5 5 Fi, у) 
j=1 j= ё 


(m/2)-1 n/2 (m/2)—1 | 


+4 У Y frida + У Ја, у) 
j=l i j=l 


m/2 m/2 (п/2)—1 


+4 )16090+2)) 5 Fi, y2j-1) 
ja jal 1 


m/2 n/2 m/2 


+4) Y fai b ў е. | 


Ј=1 il 
(п/2)—1 n/2 
ЕЕ NO Рб, Ym) КАУ Ро, Ym) 


і=1 і=1 


+ (Xp, | » 


El término de error Е está dado por 


(m/2)-1 m/2 


—k(b — ayh* Е уо) Р з аи >) з А }(&5у—1. Y2j-1) 


E= 
540 dx? 


34 F En, Ym) (d — с)* д? Р(х, и) 
E дх* | 180 f ш. 


Si ət //дх* es continua, el teorema del valor intermedio 1.11 se puede aplicar repeti- 
damente para mostrar que la evaluación de las derivadas parciales respecto a x se pueden 
reemplazar con un valor común y que 


4 4 4 pb 94 
g СКФ аһ Е д La л (а — с)к J MIDA 
540 180 Ja 3y 


para algunos (77, д) en R. Si 9* £/9y* también es continua, el teorema de valor medio para 
integrales implica que 


34 ye 
[2 = (0-а) 009, M), 


178 CAPÍTULO 4 


Ejemplo 1 


Figura 4.20 


= Diferenciación numérica e integración 


para algunos (9, (4) en R. Puesto que m = (d — c)/k, el término de error tiene la forma 


= = 4 4 — 
Е К(Ь — а)һ |з; La ] (d — c)(b а) ад“ La А), 
540 дх* 180 зу* Ô 
lo cual se simplifica еп 
_ (@—с)ф—а) [atf _ o Д 
Е = ET 6 z A) +k (0.000) 


para algunos (77, д) y (9, À) en R. 


Utilice la regla compuesta de Simpson con n = 4 y m = 2 para aproximar 


20 p15 
/ / ln(x + 2у) dy dx. 
14 J10 


Solución Los tamaños de paso para esta aplicación sonh = (2.0 — 1.4)/4 = 0.15 yk = 


(1.5 — 1.0)/2 = 0.25. La región de integración R se muestra en la figura 4.20, junto con los 
nodos (x;, yj), donde i = 0, 1,2,3,4y j = 0, 1, 2. También muestra que los coeficientes 
wi ¡de f (xi, yi) = In(x;+2y;) en la suma que da la aproximación de la regla compuesta de 
Simpson para la integral. 


La aproximación es 


15 0.15)(0.25) © Y 
f [matasa l x A S Т 
1.4 


i=0 j=0 
= 0.4295524387. 
tenemos 
atf —6 af —96 
E оу) 


y los valores máximos de los valores absolutos de estas derivadas parciales se presentan en 
R cuando x = 1.4 y y = 1.0. Por lo que el error está acotado por 


(0.5)(0.6) 


|El < 
180 


(0.15) + (0.25) < 472 x 107%, 


6 9 
(x, MaR (x + 2 yy {л OR (x + 2 yy 


Ejemplo 2 
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El valor real de la integral para 10 lugares decimales es 
20 (15 
/ / In(x + 2у) dy dx = 0.4295545265, 
1.4 J10 


por lo que la aproximación es precisa dentro de 2.1 X 107%, ш 


Las mismas técnicas se pueden aplicar рага la aproximación de las integrales triples 
así como integrales superiores para las funciones de más de tres variables. El número de 
evaluaciones requeridas para la aproximación es el producto del número de evaluaciones 
requeridas cuando se aplica el método a cada variable. 


Cuadratura gaussiana para aproximación de integral doble 


Para reducir el número de evaluaciones funcionales, se pueden incluir métodos más eficien- 
tes, como la cuadratura gaussiana, la integración de Romberg o la cuadratura adaptable, en 
lugar de las fórmulas de Newton-Cotes. El siguiente ejemplo ilustra el uso de cuadratura 
gaussiana para la integral considerada en el ejemplo 1. 


Utilice la cuadratura gaussiana con n = 3 en ambas dimensiones para aproximar la integral 


20 p15 
J f In(x + 2y) dy dx. 
Ла Ло 


Solución Antes de emplear Іа cuadratura gaussiana para aproximar esta integral, necesita- 
mos transformar la región de integración 


R=((x,y|14<x<20,10<y<l1.5)] en 
R=((u,v) | -1<u<1l-I<v<1) 
Las transformaciones lineales que cumplen esto son 


1 
и = 
2.0 — 1.4 


Qx—14-20) y v= (2y — 1.0 — 1.5), 


1 
1.5 – 1.0 


о, de manera equivalente х = 0.3и + 1.7 y y = 0.250 + 1.25. Al emplear este cambio de 
variables obtenemos una integral en Іа que se puede aplicar la cuadratura gaussiana: 


20 (15 1 pl 
/ / In(x + 2у) dy dx = 0.075 / / In(0.3u + 0.50 + 4.2) dv du. 
1.4 J10 1:41 


La fórmula de cuadratura gaussiana para п = 3 tanto en u como en v requiere que utilicemos 
los nodos 


Ui = v1 =7F32= 0, Uy = 10 = F31 = —0.7745966692, 


из = v = гуз = 0.7745966692. 


Los pesos asociados con c3,2 = 0.8 У (3.1 = C33 = 0.5. (Estos se muestran en la tabla 4.12 
en la página 232.) La aproximación resultante es 


20 (1.5 3 3 
In(x + 2y) dy dx = 0.075 C3.:C3, ¡In(0.3r3 ; + 0.5r3,; + 4.2) 
Ja hs л i 


і=1 ј=1 


= 0.4295545313. 
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A pesar de que este resultado sólo requiere nueve evaluaciones funcionales en comparación 
con 15 para la regla compuesta de Simpson considerada en el ejemplo 1, éste es preciso den- 
tro de 4.8 x 107°, en comparación con la precisión 2.1 х 1076 en el ejemplo 1. ш 


Regiones no rectangulares 


El uso de métodos de aproximación para integrales dobles no está limitado a integrales con 
regiones rectangulares de integración. Las técnicas analizadas previamente se pueden modi- 
ficar para aproximar las integrales dobles de la forma 


b d(x) 
| f(x, у) ауах (4.42) 
а с(х) 


d үр(у) 
| / Р(х, у) ахау. (4.43) 


(у) 


De hecho, las integrales еп las regiones que no son de este tipo, también se pueden aproximar 
al realizar subdivisiones adecuadas de la región. (Consulte el ejercicio 10.) 
Para describir la técnica relacionada con la aproximación de una integral de la forma 


b d(x) 
/ fx, y) dy dx, 


c(x) 


utilizaremos la regla básica de Simpson para integrar respecto a ambas variables. El tamaño 
de paso para la variable xes Л = (b — a)/2, pero el tamaño de paso para y varía con x (véase 
la figura 4.21) y se escribe 


а(х) — с(х) 


k(x) = 2 
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Esto nos da 


b d(x) b k(x) 
f Р(х, у) dy dx ғ / Е с(х)) +4} (х, с(х) + К(х)) + f(x, d(x))] dx 


с(х) 
А (к 
x ла, сау +45, са) + к(а)) + f(a, d(a))] 


3 


+ E +һ,с@а + һ)) +&4/ (а + һ,с(а +) 


+ к(а +h)) + f(a+h,d(a + һ))] 


k(b 
+ "Оу, c(b)) +47, c(b) + КЪ) + F(b, d(b))] » 


El algoritmo 4.4. aplica la regla compuesta de Simpson para una integral de la forma (4.42). 
Las integrales de la forma (4.43) pueden, por supuesto, manejarse de manera similar. 


Integral doble de Simpson 


Para aproximar la integral 


b d(x) 
1 =] Fx, y dydx: 


c(x) 
ENTRADA extremos a, b: enteros positivos pares m, n. 
SALIDA aproximación J para Г. 


Paso 1 Haga h = (b — а)/п; 

Л =0; (Términos finales.) 

Љ = 0; (Términos pares.) 

Љ = 0. (Términos impares.) 
Paso 2 Рага і = 0, 1,... ‚п haga los pasos 3-8. 


Paso З Haga х = а +іһ; (Método compuesto de Simpson para х.) 
НХ = (d(x) – с(х))/т; 
Кү = (х, с(х)) + Р(х, 4(х)); (Términos finales.) 
Kı = 0; (Términos pares.) 
K3=0. (Términos impares.) 

Paso 4 Paraj=1,2,...,m-— 1 haga los pasos 5 уб. 


Paso 5 Haga y = c(x) + jHX; 
Q = Ha, y). 
Paso 6 Sij incluso determine entonces К = K + О 
también determine Кз = Кз + O. 


Paso 7 Haga L = (Kı + 2K) + 4Кз)НХ/3. 


d(xi) 
(: У | ДО, y)dy mediante el método compuesto de Simpson ) 
соң) 


Paso 8 Sii = О о i = п entonces detemine / = Л + L 


también si į incluso determine entonces J} = J + L 
también determine J3 = J3 + L. (Paso final 2) 


Paso 9 Haga J = ҺЛ + 2J + 4J3)/3. 


Paso 10 SALIDA (J); 
PARE. ш 
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Aplicando la cuadratura gaussiana a la integral doble 
b d(x) 
f | тауа 
a c(x) 


primero debemos transformar, рага cada x en [a, b], la variable y en el intervalo [с(х), d(x)] 
en la variable en el intervalo [—1, 1]. Esta transformación lineal nos da 


(а(х) — с(х))ї +а(х) + c(x) а(х) – с(х) 
Л.» (5, > A ом; 
El cálculo reducido hace que, en Entonces, para cada x en [a, b], aplicamos la cuadratura gaussiana a la integral resultante 
general, valga la pena aplicar la 
cuadratura gaussiana en lugar d 1 
de una técnica de Simpson al н йк, y) dy = у(х (а(х) — с(х))ї +d(x) +c(x) dt 
aproximar las integrales dobles. бә ? j ш 2 


para producir 


b d(x) 
f FG, y) dy dx 
a ) 


с(х 


> d(x) — с(х) $ (а(х) — с(х))гһ„у + 4(х) + с(х) 
~ f OS a (x х) – с(х "ы х) + с(х ) e 


j=1 


mientras, como antes, las raíces г, ; y los coeficientes с, ; provienen de la tabla 4.12 en la 
página 172. Ahora, el intervalo [a, b] se transforma en [—1, 1], y la cuadratura gaussiana se 
aplica para aproximar la integral en el lado derecho de esta ecuación. Los detalles se inclu- 
yen en el algoritmo 4.5. 


Integral doble gaussiana 


b d(x) 
| теак: 
а с(х) 


ENTRADA extremos а, b: enteros positivos т, n. 
(Las raíces r; j y los coeficientes c; j necesitan estar disponibles para i = máx(m, п} 
yparal< ¡<i.) 


Para aproximar la integral 


SALIDA aproximación J para Г. 


Paso 1 Haga hı = (b — а)/2; 
h = (b + a)/2; 
J=0. 


Paso 2 Parai = 1,2,... ,m haga los pasos 3—5. 
Paso З HagaJX = 0; 


x = Атын + һә; 
4 = d(x); 
cı = с(х); 


Кү = (а = с1)/2; 
К = (dı + с1)/2. 


Paso 4 Рага j = 1, 2,... , п haga 
y = №; + Ko; 
Q = f(x, y); 
JX =JX+ cn ;jQ. 


Ilustración 


Figura 4.22 


El cálculo reducido casi siempre 
hace que valga la pena aplicar 
la cuadratura gaussiana en lugar 
de la técnica de Simpson al 
aproximar integrales triples o 
superiores. 
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Paso 5 Нава J = J + с, ikıJX. (Paso final 2.) 
Paso 6 HagaJ = hJ. 


Paso 7 SALIDA (J); 
PARE. ш 


El volumen del sólido еп la figura 4.22 se aproxima aplicando el algoritmo de la integral 
doble de Simpson con n = m = 10a 


0.5 px? 
/ f e” dy dx. 
0.1 x3 


Esto requiere 121 evaluaciones de la función f(x, у) = e*/* y produce el valor 
0.0333054, el cual aproxima el volumen del sólido mostrado en la figura 4.22 a aproximada- 
mente siete lugares decimales. Al aplicar el algoritmo de cuadratura gaussiana conn =m =5 
sólo se requieren 25 evaluaciones de función y da la aproximación 0.03330556611, lo cual 
es preciso para 11 lugares decimales. ш 


1 (01,0.01,е®!) (0.5, 0.25, е05) 


(0.1, 0.001, e01) 


(0.5, 0.25, 0) 


(0.5, 0.125, 0) 


Aproximación de integral triple 


Las integrales triples de la forma 


b р(х) pB(,y) 
[| / / Р(х, y, 2) dzdydx 
a Jc(x) а(х,у) 


(Véase la figura 4.23) se aproximan de manera similar. Debido al número de cálculos impli- 
cados, la cuadratura gaussiana es el método de elección. El algoritmo 4.6 implementa este 
procedimiento. 
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Figura 4.23 


Integral triple gaussiana 


Para aproximar la integral 


b pd) (В(х,у) 
/ / / f(x, y,z)dzdydx : 
a Jex) Ja(x,y) 


ENTRADA extremos a, b; enteros positivos m, n, p. 
(Las raíces r; j y los coeficientes сі ¡ necesitan estar disponibles para і = máxín, m, p} 
yparal < j <i.) 

SALIDA aproximación J para Г. 


Paso 1 Haga hı = (b — a)/2; 
hı = (b + a)/2; 
J=0. 


Paso 2 Para i = 1, 2,... ‚т haga los pasos 3-8. 
Paso З Haga JX = 0; 


х = Mimi + ho; 
dı = d(x); 
СІ = с(х); 


kı = (dı = с1)/2; 
ka = (dı +c1)/2. 


Paso 4 Para j = 1,2,... ‚п haga los pasos 5—7. 


Paso 5 Haga JY = 0; 
у = kirn, j + ka; 
Bi = В(х, у); 
01 = а(х, y); 
П = (fı = 01)/2; 
h = (В. + о1)/2. 
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Paso 6 Parak=1,2,...,p haga 
Haga z = li" px + b2; 
Q = f(x, y, 2); 

JY=JY+cp0. 


Paso 7 Haga JX = ЈХ + с, ¡l¡JY. (Fin del paso 4) 
Paso 8 HagaJ = Ј + cm ikıJX. (Fin del paso 2) 
Paso 9 Haga Ј =hjJ. 


Paso 10 SALIDA (J); 
PARE. ш 


El siguiente ejemplo requiere la evaluación de cuatro integrales triples. 


Ilustración El centro de masa de una región sólida D con función de densidad о se presenta en 


A My. Му, Myy 
бу.) = (T =, М * 


donde 


м.= Jf хо(х, у, 2) У, м.= ||] ус (х, у, 2) ау 
р р 
m= | [| го (х,у, 2)dV 

р 


son los momentos alrededor de los planos coordenados у la masa de D es 


M= ҮШ o(x, у, 2) dV. 
D 


El sólido mostrado en la figura 4.24 está acotado por la parte superior del cono z? = x? + y? 
y el plano z = 2. Suponga que este sólido tiene una función de densidad dada por 


0(x,y,2) = yx? + y?. 


Figura 4.24 
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4,9 


Figura 4.25 


Al aplicar el algoritmo de integral triple gaussiana 4.6 con n = m = р = 5 requiere 125 eva- 


luaciones de función por integral y se obtienen las siguientes aproximaciones 


Yi? 
M= А / ух? + y? dz dy dx 
К к Йе. 


2 м2 2 
= : | / / х2 + y? dz dy dx = 8.37504476, 
ы a 


z „ХМХ + y? dzdydx % —5.55111512 x 107", 
ми =]. Г х? и m 


Yi? 
m= f |: у? + y? dz dy dx = —8.01513675 х 107" y 


4— Yi? 
AN + y? dz dy dx = 13.40038156. 
m= f ppa х2 Ja/x 


Esto implica que la ubicación aproximada del centro de la masa es 


(х, y, 2) = (0, 0, 1.60003701). 


Estas integrales son bastante fáciles de evaluar de manera directa. Si Іо hace, descubrirá que 


el centro de masa exacto se presenta en (0, 0, 1.6). 


La sección Conjunto de ejercicios 4.8 está disponible en línea. Encuentre la ruta de 


acceso en las páginas preliminares. 


Integrales impropias 


Las integrales impropias resultan cuando la noción de integración se amplía, ya sea en un 
intervalo de integración en el que la función no está acotada en un intervalo con uno o más 
extremos infinitos. En cualquier circunstancia, las reglas normales de una aproximación in- 


tegral se deben modificar. 


Singularidad del extremo izquierdo 


Primero consideraremos la situación en la que el integrando no está limitado en el extremo 
izquierdo del intervalo de integración, como se muestra en la figura 4.25. En este caso, de- 
cimos que f tiene una singularidad en el extremo a. A continuación, mostramos cómo se 
pueden reducir las integrales impropias para problemas de este tipo. 


Se a o ы шш кышы карш 


Ejemplo 1 
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En cálculo se muestra que la integral impropia con una singularidad en el extremo iz- 


quierdo, 
/ b dx 
a (x = ay? | 


converge si y sólo 810 < p < 1, y en este caso, definimos 


b 1 y (х = a)! P 
— dx= lím -— 
a (x—ay? M>sat 1—р 


x=b Е (b КЕ а)!» 


х= М 1-р 


1 
1 

Muestre que la integral impropia {= — dx converge pero que / ~ Ax diverge. 
о X 


Solución Para la primera integral, tenemos 


1 al 
1 x=1 
—dx= lím x~? ах = lím 2x! =2-0=2, 
I мк м=0+ Ји ма, ш 


pero la segunda integral 


1 
а= lím x?dx= lím —x7 
M>0+ Jm M>0+ 


es infinita. ш 
Si f es una función que se puede escribir en la forma 


g) 
Р(х) = Gar’ 


donde 0 < p < 1 y g es continua en [a, b], entonces la integral impropia 


b 
f f(x)dx 


también existe. Nosotros aproximaremos esta integral mediante la regla compuesta de Simp- 
son, siempre que g € C%[a, b]. En ese caso, construimos el cuarto polinomio de Taylor 
Paíx), para g alrededor de a, 


n m (4) 
рих) = ва) + а) а) + Ela Qda a, 
y escribimos 
ае, Рх), 
[лое | = a | (4.44) 


Puesto que P(x) es un polinomio, podemos determinar con exactitud el valor de 
4 


>” Рх). e UE 84 (a) E 
A ES 


(4.45) 
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Ejemplo 2 
Tabla 4.13 
x G(x) 

0.00 0 

0.25 0.0000170 

0.50 0.0004013 

0.75 0.0026026 

1.00 0.0099485 


Por lo general, la parte dominante de la aproximación, en especial cuando el polinomio de 
Taylor Р(х) concuerda de cerca con g(x) en todo el intervalo [a, b]. 
Para aproximar la integral de f, debemos añadir este valor a la aproximación de 


f 80) – Риб) y 


(х – а)? 


Para determinar esto, primero definimos 


8(х)— Рд(х) : 
Cu Saa? 5 81а <х < р, 
0, 51 Хх = а. 


Esto nos da una función continua en [а, b]. De hecho, 0 < р < 1 y PP (a) concuerda con 
8% (а) para cada k = 0,1,2,3,4, рог lo que tenemos С є C*[a, b]. Esto implica que la 
regla compuesta de Simpson se puede aplicar para aproximar la integral de G sobre [a, b]. 
Al añadir esta aproximación al valor de la ecuación (4.45) obtenemos una aproximación 
para la integral impropia de fen [a, b], dentro de la precisión de la aproximación de la regla 
compuesta de Simpson. 


Utilice la regla compuesta de Simpson con Л = 0.25 para aproximar el valor de la integral 
impropia 


[ ех F 
=: 
o мх 


Solución El cuarto polinomio de Taylor рага е" alrededor de x = О es 


2 x3 х“ 


X 
P. =1 == = 
4) =1 +14 + ы 
Ух 


1 1 
Р, (х) -12 12 a 1 1 
ах = „—1/ / 3/2 5/2 7/2 \ dx 
/ JE XxX / (х +" 2" F с" =F зд? XxX 


1 
por lo que la parte dominante de la aproximación рага | ах е$ 
Jo 


1 


2 1 1 1 
kí 21/2 3/2 5/2 7⁄2, + 9/72 
Moot | ¡e E T 


M 


2 1 1 1 
=2 x 2.9235450. 
татыта + т ú 


1 Ed 
Я ТИВ е > А 
Рага la segunda parte de la aproximación para f R dx, necesitamos aproximar 
0 X 


1 
/ G(x) dx donde 
0 А 


1 

— (e — Р(х), ві 0<х<1, 

б) AS „(х)), ві О<х < 
0, si х = 0. 


Га tabla 4.13 enumera los valores necesarios para la regla compuesta de Simpson para esta 


aproximación. 
Por medio de estos datos y la regla compuesta de Simpson obtenemos 


| 0.25 
| С(х) dx = — 
0 3 


= 0.0017691. 


[0 + 4(0.0000170) + 2(0.0004013) + 4(0.0026026) + 0.0099485] 


Figura 4.26 
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Por lo tanto, 


1 Ж 
/ 68 ах ғ 2.9235450 + 0.0017691 = 2.9253141. 
o yx 


Este resultado es preciso dentro de la precisión de la aproximación de la regla compuesta 
de Simpson para la función G. Puesto que |С (x)| < 1 en [0, 1], el error está acotado por 


їй Le 
———(0.25)# = 0.0000217. m 
180 


Singularidad en el extremo derecho 


Para aproximar la integral impropia con una singularidad en el extremo derecho, podemos 
desarrollar una técnica similar, pero expandiendo los términos del extremo derecho b en lu- 
gar del extremo izquierdo a. De forma alternativa, podemos realizar la sustitución 


z= =y, dz==dx 


para cambiar la integral impropia en una de la forma 


b —a 
i Fx) dx = FED dz, (4.46) 
a —b 


la cual tiene su singularidad en el extremo izquierdo. Entonces, podemos aplicar la técnica 
de singularidad del extremo izquierdo que ya habíamos desarrollado. (Véase la figura 4.26.) 


Una integral impropia con una singularidad en c, donde a < c < b, se trata como la 
suma de las integrales impropias con singularidades en los extremos ya que 


b с b 
[люе | го) ах | Тоа, 


Singularidad infinita 


El otro tipo de integral impropia implica límites infinitos de integración. La integral básica 
de este tipo tiene la forma 
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para p > 1. Esto se convierte en una integral con singularidad de extremo izquierdo en 0 al 
realizar la sustitución de integración 


t=x "1, di=-x?dx, porloque dx = х? dt = -t° dt. 
Entonces 
оо 1 0 [Р 1/а 1 
— dx = => dt = =— dt 
/ х? | a Ë | б-р 
De forma similar, el cambio de variable + = х7! convierte la integral impropia 


So f(x) dx en una que tiene singularidad de extremo izquierdo en cero: 


“00 1/a 
/ f(x) dx >] ef (5) dt. (4.47) 


Ahora, se puede aproximar por medio de la fórmula de cuadratura del tipo descrito anterior- 
mente. 


Ejemplo 3 Aproxime el valor de la integral impropia 


Solución Primero realizamos el cambio de variable г = x”!, el cual convierte la singulari- 
dad infinita en una con una singularidad de extremo izquierdo. Entonces 


dt = –х? dx, por lo que dx = =x? dt = -5 dt, 


x=00 1 1=0 1 3/2 1 1 
е, хатак | G) sen ź (-2&) - | t! ѕеп г аг. 
x=1 xX t=1 t t 0 


El cuarto polinomio de Taylor, P4(t), para sen t alrededor de 0 es 


Pa(t) =1 — La 
6 
por lo tanto, 
seni—=t+ He 
G(t) = 11/2 ' 
0, 517 = 0 


siO<t<l1 


está en C*[0, 1], y tenemos 


1 1 ї 3 
1 sent — t + 1 
Iz= 171/2 pazi dt + 6 dt 
0 6 0 p1/2 


sent — t + 203 
= rpn Lon] dt 
к. o=o paeo 


sent — t + it? 


1 
= 0.61904761 pe — ma dt. 
0 
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El resultado a partir de la regla compuesta de Simpson con n = 16 para la integral restante 
es 0.0014890097. Esto da una aproximación final de 


I = 0.0014890097 + 0.61904761 = 0.62053661, 


lo cual es preciso dentro de 4.0 х 1078. п 


La sección Conjunto de ejercicios 4.9 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Software numérico y revisión del capítulo 


La mayoría del software para integrar una función de una única variable real está basado 
ya sea en el enfoque adaptable o en fórmulas gaussianas extremadamente precisas. La in- 
tegración cautelosa de Romberg es una técnica adaptable que incluye una verificación para 
garantizar que el integrando se comporta suavemente sobre los subintervalos de la integral 
de integración. Este método se ha utilizado con éxito en bibliotecas de software. En general, 
múltiples integrales se aproximan con la ampliación de buenos métodos adaptables hasta 
dimensiones superiores. La cuadratura del tipo gaussiano también se recomienda para dis- 
minuir el número de evaluaciones de función. 

Las rutinas principales en las bibliotecas IMSL y NAG están basadas en QUADPACK: 
A Subroutine Package for Automatic Integration (QUADPACK: Un paquete de subrutinas 
para integración automática) de R. Piessens, E. de Doncker-Kapenga, C. W. Uberhuber y D. 
K. Kahaner y publicado por Springer-Verlag en 1983 [PDUK]. 

La biblioteca IMSL contiene un esquema de integración adaptable con base en la regla 
Gaussiana-Kronrod de 21 puntos mediante la regla gaussiana de 10 puntos para cálculo 
de error. Las reglas gaussianas utilizan 10 puntos x1, ... , X10 Y pesos W1],... , Wo para la 
fórmula de cuadratura e ES wi f (xi) para aproximar Le f(x) dx. A continuación se utilizan 
los puntos adicionales X11,... , X21, y los pesos nuevos v1, ... , V21, en la fórmula de Kron- 
rod Ж, vi f (xi). Los resultados de las dos fórmulas se comparan para eliminar el error. 
La ventaja de utilizar x1,... , х10 en cada fórmula es que f sólo necesita evaluarse en 21 
puntos. Si se utilizaran reglas gaussianas independientes de 10 y 21 puntos, se necesitarían 
31 evaluaciones de función. Este procedimiento permite singularidades de extremo en el 
integrando. 

Otras subrutinas IMSL permiten singularidades de extremo, singularidades especificadas 
porel usuario e intervalos infinitos de integración. Además, existen rutinas para aplicar reglas de 
Gauss-Kronrod para integrar una función de dos variables y una rutina para utilizar cuadratura 
para integrar una función de n variables sobre n intervalos de la forma [a;, b;]. 

La Biblioteca NAG incluye una rutina para calcular la integral de f sobre el intervalo 
[a, b] mediante un método adaptable con base en cuadratura gaussiana mediante reglas de 
Kronrod de 21 puntos y de Gauss de 10 puntos. También tiene una rutina para aproximar 
una integral mediante una familia de fórmulas tipo gaussianas con base en 1, 3, 5, 7, 15, 31, 
63, 127 y 255 nodos. Estas reglas entrelazadas de alta precisión se deben a Patterson [Pat] 
y se utilizan de manera adaptable. NAG incluye muchas otras subrutinas para aproximar 
integrales. 

A pesar de que la diferenciación numérica es inestable, se necesitan fórmulas de aproxi- 
mación de derivadas para resolver ecuaciones diferenciales. La Biblioteca NAG incluye una 
subrutina para la diferenciación numérica de una función de una variable real con diferencia- 
ción para que la catorceava derivada sea posible. IMSL tiene una función que usa un cambio 
adaptable en tamaño de paso para diferencias finitas para aproximar la primera, segunda o 
tercera derivada de f en x dentro de una tolerancia determinada. IMSL también incluye una 
subrutina para calcular las derivadas de una función definida en un conjunto de puntos me- 
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diante interpolación cuadrática. Ambos paquetes permiten la diferenciación e integración de 
splines cúbicos interpolantes construidos por las subrutinas mencionadas en la sección 3.5. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Problemas de valor inicial para ecuaciones de 
diferenciales ordinarias 


Introducción 


El movimiento de un péndulo balanceándose de acuerdo con ciertas suposiciones de simpli- 
ficación se describe por medio de la ecuación diferencial de segundo orden. 


donde L es la longitud del péndulo, g = 32.17 pies/s? es la constante gravitacional de la 
Tierra, y Ө es el ángulo del péndulo con la vertical. Si, además, especificamos la posición del 
péndulo cuando el movimiento empieza, Ө (10) = бө, y su velocidad en ese punto, 0’ (to) = 00, 
tenemos lo que recibe el nombre de problema de valor inicial. 

Para los valores pequeños de Ө, la aproximación 0 = sen Ө se puede utilizar para simpli- 
ficar el problema de valor inicial lineal 

20 g ; 

qe + т =0, 0(0) = 0, Өө (to) = Ө). 
Este problema se puede resolver con una técnica de ecuación diferencial estándar. Para los 
valores más grandes de 0, la suposición de que Ө = sen 6 no es razonable, por lo que deben 
usarse los métodos de aproximación. Un problema de este tipo se considera en el ejercicio 7 
de la sección 5.9. 

Cualquier libro de texto sobre ecuaciones diferenciales detalla diferentes métodos para 
encontrar soluciones a los problemas de valor inicial de primer orden de manera explícita. 
Sin embargo, en la práctica, pocos problemas que se originan a partir del estudio de fenóme- 
nos físicos se pueden resolver con exactitud. 
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Teorema 5.4 


Ejemplo 2 


en su segunda variable, y la condición (5.1) es generalmente más fácil de aplicar que la 
definición. Sin embargo, deberíamos observar que el teorema 5.3 solamente proporciona 
condiciones suficientes para mantener la condición de Lipschitz. La función en el ejemplo 1, 
por ejemplo, satisface la condición de Lipschitz, pero la derivada parcial respecto a y no 
existe cuando y = 0. 

El siguiente teorema es una versión del teorema fundamental de existencia y unicidad 
para ecuaciones diferenciales ordinarias de primer orden. A pesar de que el teorema se pue- 
de probar reduciendo la hipótesis de alguna forma, esta versión es suficiente para nuestros 
propósitos. (La prueba del teorema, enunciado de esta forma, se puede encontrar en [BiR], 
pp. 142-155.) 


SupongaqueD = { (1, у) |а<7 < Бу – оо < y< 00) y que f(t, y) es continua en D. Sif 
satisface la condición de Lipschitz en D en la variable y, entonces el problema de valor inicial 


y= Р, у), ast<b, у(ау=о, 
tiene una única solución y(t) para a <t < b. Г 


Utilice el teorema 5.4 para mostrar que existe una única solución para el problema de valor 
inicial 


y =1++sen(ty), O<t<2, y(0)=0. 
Solución Al mantener t constante y aplicar el teorema de valor medio para la función 
f(t, у) = 1+ tsen(ty), 


encontramos que cuando yı < у», existe un número é еп (уу, ух) con 


fE, у) – fey) д f(t, Е) =P соѕ(ёр). 
уз — У\ ду 


Por lo tanto, 


IEE, y) — FE, yl = ly — у 12 со5 (0) < 4y2 — yıl, 


y f satisface la condición de Lipschitz en la variable y con constante de Lipschitz L = 4. 
Además, f (t, y) es continua cuando 0 < t < 2y –оо < у < оо, por lo que el teorema 5.4 
implica que existe una única solución para este problema de valor inicial. 

Si usted ha completado un curso sobre ecuaciones diferenciales, podría intentar encon- 
trar la solución exacta para este problema. п 


Problemas bien planteados 


Ahora que hemos, hasta cierto punto, atendido la cuestión de cuando los problemas de valor 
inicial tienen soluciones únicas, podemos mover la segunda consideración importante al 
aproximar la solución para un problema de valor inicial. En general, los problemas de valor 
inicial obtenidos al observar el fenómeno físico solamente aproximan la verdadera situación, 
por lo que necesitamos saber si los pequeños cambios en la declaración del problema intro- 
ducen pequeños cambios en la solución en la misma medida. Esto también es importante 
debido a la introducción del error de redondeo cuando se usan métodos numéricos. Esto es, 


e Pregunta: ¿Cómo determinamos si un problema particular tiene la propiedad de que pe- 
queños cambios o alteraciones del problema introduzcan pequeños cambios en la solución 
en la misma medida? 


Como siempre, primero necesitamos proporcionar una definición práctica para expresar este 
concepto. 
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= Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


La primera parte de este capítulo se preocupa por aproximar la solución y(t) рага un 

problema de la forma 

dy 

—— =/@,у), paraa=<t<b, 

dt 
sujeto a la condición inicial y(a) = œ. Más adelante en este capítulo tratamos con la exten- 
sión de estos métodos hacia un sistema de ecuaciones diferenciales de primer orden de la 
forma 


1 ла 
dt 1 ‚ Y1, У2,.--› Уп)» 
ду» 

Tu S t, , yes) > 
q = РУ 0 Yn) 
d 

=r = ft, Yis У2,... Уп), 


para a < t < b, sujeto a las condiciones iniciales 
yıla) = о, y2(4)=0%, ..., Ynla) = о. 


También examinamos la relación de un sistema de este tipo con el problema de valor inicial 
de enésimo orden de la forma 


-1 
у® = fe, y, y, y" ?), 
paraa < t < b, sujeto a las condiciones iniciales 


y(a)=01, у(а) = а, ..., y” (a) = о. 


Teoría elemental de problemas de valor inicial 


Las ecuaciones diferenciales se usan para modelar problemas en la ciencia y la ingeniería 
que implican el cambio de alguna variable respecto a otra. Muchos de estos problemas re- 
quieren la solución de un problema de valor inicial, es decir, la solución a una ecuación 
diferencial que satisface una condición inicial determinada. 

En situaciones de la vida real común, la ecuación diferencial que modela el problema es 
demasiado complicada para resolverse de manera exacta y se toma uno de dos enfoques para 
aproximar la solución. El primer enfoque es modificar el problema al simplificar la ecuación 
diferencial por una que se pueda resolver de manera exacta y, a continuación, utilizar la 
solución de la ecuación simplificada para aproximar la solución para el problema original. 
El otro enfoque, que se examinará en este capítulo, usa métodos para aproximar la solución 
del problema original. Este es el enfoque que se toma con más frecuencia debido a que los 
métodos de aproximación dan resultados más precisos e información del error más realista. 

Los métodos que consideramos en este capítulo no producen una aproximación continua 
para la solución del problema de valor inicial. Más bien, las aproximaciones se encuentran 
en ciertos puntos específicos y a menudo igualmente espaciados. Normalmente se usa algún 
método de interpolación, por lo general el de Hermite, si se necesitan valores intermedios. 

Nosotros necesitamos algunas definiciones y resultados a partir de la teoría de las ecua- 
ciones diferenciales ordinarias, al considerar métodos para aproximar las soluciones a los 
problemas de valor inicial. 


Definición 5.1 


Ejemplo 1 


Definición 5.2 


Figura 5.1 


Teorema 5.3 


Rudolf Lipschitz (1832-1903) 
trabajó en muchas ramas de las 
matemáticas, incluyendo la teoría 
numérica, las series de Fourier, 
las ecuaciones diferenciales, la 
mecánica analítica y la teoría del 
potencial. Es mejor conocido por 
esta generalización del trabajo 
de Augustin—Louis Cauchy 
(1789-1857) y Guiseppe Peano 
(1856-1932). 
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ИСУ 


Se dice que una función f(t, y) satisface la condición de Lipschitz en la variable y en un 
conjunto D C R? si existe una constante L > 0 con 


А0, у) — РС, ya, )1 < Цу — yal, 


siempre que (t, y1) у (t, y2) estén еп D. La constante L recibe el nombre de constante de 
Lipschitz para f. н 


Muestre que f(t, у) = ї|у| satisface la condición de Lipschitz en el intervalo D = { (t, y) 
[1<т<2у=3<у=<4). 


Solución Para cada par de puntos (t, y1) у (t, y2) en D, tenemos 


IFE у) = РС, yl = у= tly2 11 = || lyi] = Iy2ll < 2ly1 — yal. 


Por lo tanto, f satisface la condición de Lipschitz en D en la variable y con la constante 2 de 
Lipschitz. El valor más pequeño posible para la constante de Lipschitz para este problema es 
L = 2 porque, por ejemplo, 


0,0) - f@,0)| = |2—0| = 2/1 — 01. m 


Se dice que un conjunto D C R? es convexo siempre que (t1, y1) у (t2, ух) pertenezcan а D, 
entonces ((1 — Уг + АБ, (1 — А)у + Ay) también pertenece a D para cada A en [0, 1]. ш 


En términos geométricos, la definición 5.2 establece que un conjunto es convexo a 
condición de que siempre que dos puntos pertenezcan a un conjunto, todo segmento de 
línea recta entre los puntos también pertenezca al conjunto (consulte la figura 5.1 y el 
ejercicio 7.) En general, los conjuntos que consideramos en este capítulo son de la forma 
"р = {(, у) [а<1 < ру – оо < y< оо} para algunas constantes a y b. Es fácil verificar 
(consulte el ejercicio 9) que estos conjuntos son convexos. 


Convexo No convexo 


Suponga que f(t, y) se define sobre un conjunto convexo D С №2. Si existe una constante 
L>0 con 


—(t, у)| < L, рага одо (t, y) € D, (5.1) 


of 
dy 


entonces f satisface la condición de Lipschitz en D en la variable y con constante L de 
Lipschitz. п 


La demostración del teorema 5.3 se analiza en el ejercicio 8; es similar a la prueba del 
resultado correspondiente para funciones de una variable, analizadas en el ejercicio 28 de la 
sección 1.1. 

Como veremos en el siguiente teorema, a menudo es de interés significativo para determi- 
nar si la función implicada en el problema de valor inicial satisface la condición de Lipschitz 
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Definición 5.5 El problema de valor inicial 


Teorema 5.6 


Ejemplo 3 


dy 
q PE a<tx<b, у(а) =0, (5.2) 
se dice que es un problema bien planteado si: 


e Existe una única solución, y(t), y 


e Existen constantes єр > Оук > 0, tales que para cualquier e en (0, €0), siempre que 8(+£) 
es continua con |ô(t)| < e para toda г en [a, b], y cuando [50| < e, el problema de valor 
inicial 

dz 


n =F(12+8(0), a<t<b, z(a) = а + 80, (5.3) 


tiene una única solución z(t) que satisface 
|2(@) — y(t)| < ke рага toda гер [a, b]. ш 


El problema especificado рог la ecuación (5.3) recibe el nombre de problema pertur- 
bado relacionado con el problema original en la ecuación (5.2). Supone la posibilidad de un 
error introducido en la declaración de la ecuación diferencial, así como un error д presente 
en la condición inicial. 

Los métodos numéricos quizá impliquen resolver un problema perturbado debido a que 
cualquier error de redondeo introducido en la representación perturba el problema original. 
A menos que se plantee el problema original, existen pocas razones para esperar que la solu- 
ción numérica para un problema de este tipo se aproximaría con precisión a la solución del 
problema original. 

El siguiente teorema especifica las condiciones que garantizan un problema de valor 
inicial bien planteado. La demostración de este teorema se puede encontrar en [BiR], pp. 
142-147. 


Suponga que D=((t,y)|a<t<by-—0o0< y< оо). Si fes continua y satisface la 
condición de Lipschitz en la variable y sobre el conjunto D, entonces el problema de valor 
inicial 


dy 
y = ФУ) a<t<b, y(a)=0 


está bien planteado. п 


Muestre que el problema de valor inicial 
—=y-P+1, 0<t<2, y(0)=055, (5.4) 


está bien planteado en D = { (t, у) |0 <71 < 2у - о <у<о}. 


Solución Puesto que 


2 
o +5 1112 
ду 
el teorema 5.3 implica que f(t, у) = y—t?+1 satisface la condición de Lipschitz en y 
sobre D con la constante de Lipschitz 1. Puesto que fes continua en D, el teorema 5.6 implica 
que el problema está bien planteado. 
Como ilustración, considere la solución para el problema perturbado 
dz 


e ее, 0<+<2, 2(0)=0.5+ 80, (5.5) 
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donde ô y бу son constantes. Las soluciones a las ecuaciones (5.4) y (5.5) son 
у@) = (0+ 1)? – 0.5е у z(t) = (t +1? + (8 +8) -0.5)e' — ô, 


respectivamente. 
Suponga que e es un número positivo. Si |8| < e y [50| < e, entonces 


|у@) – :@)| = 108 + %)е' — 8] < |8 + Sole? + 18] < (2e? + 1)в 


para todas las т. Esto implica que el problema (5.4) está bien planteado con k(e) = 2e? + 1 para 
todas las e > 0. ш 


La sección Conjunto de ejercicios 5.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 5.2 Método de Euler 


El uso de métodos de diferencia 
básica para aproximar la solución 
a las ecuaciones diferenciales 

fue uno de los diferentes temas 
matemáticos que se presentaron 
primero al público por el más 
prolífico de los matemáticos, 
Leonhard Euler (1707-1783). 


El método de Euler es la técnica de aproximación más básica para resolver problemas de 
valor inicial. A pesar de que rara vez se usa en la práctica, la simplicidad de su derivación 
se puede utilizar para ilustrar las técnicas relacionadas con la construcción de algunas de las 
técnicas más avanzadas, sin el álgebra engorrosa que acompaña estas construcciones. 

El objetivo del método de Euler es obtener aproximaciones para el problema de valor 
inicial bien planteado 


2 = /@,у), ast<b, у(а) =а. (5.6) 
No se obtendrá una aproximación continua a la solución y(£); en su lugar, las aproxima- 
ciones para y se generarán en varios valores, llamados puntos de malla, en el intervalo [a, b]. 
Una vez que se obtiene la solución aproximada en los puntos, la solución aproximada en 
otros puntos en el intervalo se puede encontrar a través de interpolación. 
Primero estipulamos que los puntos de malla están igualmente espaciados a lo largo del 
intervalo [a, b]. Esta condición se garantiza al seleccionar un entero positivo N, al establecer 
h = (b — а)/ №, y seleccionar los puntos de malla 


t¡=a+ ih, рагасайа i = 0, 1, 2,..., М. 


La distancia común entre los puntos Л = t;+1 — t; recibe el nombre de tamaño de paso. 
Usaremos el teorema de Taylor para deducir el método de Euler. Suponga que y(t), la 

única solución para (5.6), tiene dos derivadas continuas en [a, b], de tal forma que cada 

¿¡=0,1,2,...,N—1, 

(liga — ti 


2 
Y ivi) = y (ti) + (liga — ti) y (ti) + 2 у” É), 


para algún número ё; en (t;, t;+1). Puesto que h = р — ti, tenemos 


h2 
Yiz) = y (ti) + hy’ (ti) + 27У (80), 


у ya que y(t) satisface Іа ecuación diferencial (5.6), 
2 


h 
уй) = y(t) + Af (ti, у) + 7 Y 65). (5.7) 


Ilustración 
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El método de Euler construye w; œ% y(t;), рага cadai = 1, 2,... , №, al borrar el término 
restante. Por lo tanto, el método de Euler es 


Wo = Q, 
Wip =W¡+hf(t;,w;¡), para cada i = 0, 1,..., № — 1. (5.8) 
En el ejemplo 1, usaremos un algoritmo para el método de Euler para aproximar la solución de 
y =y-—tť +1, 0<t<2, y(0)=0.5, 


en £ = 2. Aquí simplemente ilustraremos los pasos en la técnica cuando tenemos h = 0.5. 
Para este problema f(t, y) = y — t? + 1; por lo que, 


wọ = y(0) = 0.5; 

урт = wo + 0.5 (wo — (0.0)? + 1) = 0.5 + 0.5(1.5) = 1.25; 

w2 = wı + 0.5 (w; — (0.5)? + 1) = 1.25 +0.5(2.0) = 2.25; 
w3 = w2 + 0.5 (w2 — (1.0)? + 1) = 2.25 +0.5(2.25) = 3.375; 


y(2) ~ w4 = w3 +0.5 (ws — (1.5)? + 1) = 3.375 + 0.5(2.125) = 44375. ш 


La ecuación (5.8) recibe el nombre de ecuación de diferencia relacionada con el mé- 
todo de Euler. Como veremos más adelante en este capítulo, la teoría y la solución de ecua- 
ciones de diferencia son paralelas, en muchas formas, a la teoría y solución de ecuaciones 
diferenciales. El algoritmo 5.1 implementa el método de Euler. 


Método de Euler 


Para aproximar la solución del problema de valor inicial 


у'=/@,у), a<t<b, у(а) =а, 
en (N + 1) números igualmente espaciados en el intervalo [a, b]: 
ENTRADA extremos a, b; entero N; condición inicial а. 


SALIDA aproximación w para y еп (N + 1) valores de £. 


Paso 1 Determine h = (b — a)/N; 
t=a; 
w =q; 
SALIDA (t, w). 


Paso 2 Para i = 1,2,... , N haga los pasos 3, 4. 


Paso З Determine w =w +hf(t,w); (Calcule w;.) 
t=a+ih. (Calcule ti.) 


Paso 4 SALIDA (t,w). 
Paso 5 PARE. 


Para interpretar el método de Euler de manera geométrica, observe que cuando w; es 
una aproximación cercana para y (£;), la suposición de que el problema está bien planteado 
implica que 


Ра, м) S y (4) = fti, y(t;)). 
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Figura 5.2 


Figura 5.3 


La gráfica de la función que resalta y (t,) se muestra en la figura 5.2. Un paso en el 
método de Euler aparece en la figura 5.3 y una serie de pasos aparece en la figura 5.4. 


Y4 
Yn) = УФ) 7 


Figura 5.4 


Pendiente y'(a) = f(a, а) 


Ejemplo 1 


El método de Euler se usó en la primera ilustración con h = 0.5 para aproximar la solución 
al problema de valor inicial 


у\=у— +1, 0<t<2, у(0) = 0.5. 


Utilice el algoritmo 5.1 соп № = 10 para determinar aproximaciones y compárelas соп los 
valores exactos dados por y(t) = (t + 1)? —0.5e*. 


Solución Con N = 10, tenemos h = 0.2, ti = 0.21, wo = 0.5, y 

иы = Wi + h(w; — t? + 1) = w; +0.2[w; — 0.041? + 1] = 1.2w; — 0.0081? + 0.2, 
parai =0,1,... , 9. Por lo que, 

м = 1.2(0.5) — 0.008 (0)? + 0.2 = 0.8, и» = 1.2(0.8) — 0.008 (1)? + 0.2 = 1.152, 


y así sucesivamente. La tabla 5.1 muestra la comparación entre los valores aproximados en t; 
y los valores reales. и 


Tabla 5.1 


Lema 5.7 


Lema 5.8 


ti Wi Yi = y(t) ly; — wil 
0.0 0.5000000 0.5000000 0.0000000 
0.2 0.8000000 0.8292986 0.0292986 
0.4 1.1520000 1.2140877 0.0620877 
0.6 1.5504000 1.6489406 0.0985406 
0.8 1.9884800 2.1272295 0.1387495 
1.0 2.4581760 2.6408591 0.1826831 
1.2 2.9498112 3.1799415 0.2301303 
14 3.4517734 3.7324000 0.2806266 
1.6 3.9501281 4.2834838 0.3333557 
1.8 4.4281538 4.8151763 0.3870225 
2.0 4.8657845 5.3054720 0.4396874 
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Observe que el error crece ligeramente conforme el valor de £ aumenta. Este crecimiento 
de error controlado es una consecuencia de la estabilidad del método de Euler, lo cual impli- 
ca que se espera que el error no crezca de una manera mejor a la forma lineal. 


Cotas del error para el método de Euler 


A pesar de que el método de Euler no es por completo apropiado para garantizar su uso en 
la práctica, es suficientemente básico para analizar el error producido a partir de esta aplica- 
ción. El análisis de error para los métodos más precisos que consideramos en las secciones 


subsiguientes sigue el mismo patrón, pero es más complicado. 


Para derivar una cota del error para el método de Euler, necesitamos dos lemas de 


cálculo. 


Рага toda х > —1 y cualquier m positiva, tenemos 0 < (1 +x)” < e™. 


Demostración Al aplicar el teorema de Taylor con f(x) = е", хо =0,y п = 1 obtenemos 


donde ё está entre x y cero. Por lo tanto, 


loe y 
ostit Ей te Ser, 


y, puesto que 1 + x > 0, tenemos 


Si s y Г son números reales positivos, {a;}{ ев una sucesión que satisface ао > —t/s, y 


entonces 


апы < (1 +s)ai +t, 


0< (1+ х)" < (е^)"” = e", 


А t 
а < еї+105 (а Е =) 


1 
е=1+х+ ue, 


para сайа ¿=0,1,2,...,k—1, 


Demostración Рага un entero fijo i, la desigualdad (5.9) implica que 
а+ < (1+5)a; +t 
< AHO +94 +t +t = Asai 4114 (1 + 5) 


< (+59 aat [aHa] 


< (1+ 5) ao + П+(@+5)+(1-+Е5)°+5 5). 


(5.9) 
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Pero 
O 
j=0 
es una serie geométrica con radio (1 + s) que se suma a 


а + 5) – 1]. 


l=(145* 1 
1=- (1+5) s 


Por lo tanto, 


| 1 i+l _ 1 
am < (1 +5) ау + сеи 


: t t 
t=(1+s)™ (a, + ) =-, 
5 


S 


y por el lema 5.7 con x = 1 + s obtenemos 


Teorema 5.9 Suponga que fes continua y satisface la condición de Lipschitz con constante L en 
р ={(,у) |а<1<Бу –- оо <у < оо} 
y que existe una constante М con 
ly(0| <M, рага todas las г € [a, b], 
donde y(1) denota la única solución para el problema de valor inicial 


y'= /@,у), a<t<b, у(а)=в. 


Sean Wo, W1,... , wy las aproximaciones generadas por el método de Euler рага un entero 
positivo N. Entonces, рага cada i = 0, 1,2,..., №, 
hM . 
ya) ws y |80 1]. (5.10) 


Demostración Cuando i = 0, el resultado es claramente verdadero ya que y (tp) = Wo = о. 
A partir de la ecuación (5 7), tenemos 


h2 
Yi) = y(t) + Af (ti, уба) + 57У (80), 


parai = 0, 1,..., N— 1, y a partir de las ecuaciones ер (5.8) 
иы = и БАР, wi). 
Usando la notación y; = y (ti) y уі = У(ї+1), restamos estas dos ecuaciones para obtener 
h2 
йн = Wisi = Yi — Wi HALS ti, yi) — f (ti, №) + 57У E 


Por lo tanto, 


h? ” 
ры — Игры] < [yi — wil + hlf Cti, y) — РО, wi) + 31 (E,)1. 


Ejemplo 2 
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Ahora f satisface la condición de Lipschitz en la segunda variable con constante L y 
ly"(1)| < M, por lo que 


ә 


АМ 
|йгы иы < 1 + AL) ly; — wil + E 


De acuerdo con el lema 5.8 y haciendo s =hL,t=h?M/2, y aj=ly;—wjl, para 
cada j = 0, 1,... , N, observaremos que 


r) h? M 


G+DAL 
0 — М; <е w A 
уы +1] < (vo ol + ЭЙТ: ОЙТ. 


Puesto que |yo — мо = Оу (i + 1)л = р — to = бр — a, esto implica que 
hM - 
ун — Улы] < a oE 1), 


para cada i = 0, 1,..., N — 1. ш 


La debilidad del teorema 5.9 depende del requisito de conocer una cota para la segunda 
derivada de la solución. A pesar de que, a menudo, esta condición nos prohíbe obtener una 
cota de error realista, se debería observar que si existe д//0 y 9f/0y, la regla de la cadena 
para la diferenciación parcial implica que 


ау! а д д 
y" (1) = O = Ea у@)) = Lay) T La, y(1)) - F(t, yO). 


Por lo tanto, algunas veces es posible obtener una cota de error para y”(t) sin conocer explí- 
citamente y (1). 


La solución para el problema de valor inicial 
у\=у— +1, 0O<t<2, у(0) = 0.5, 


se aproximó en el ejemplo 1 con el método de Euler con h = 0.2. Utilice la desigualdad en 
el teorema 5.9 para encontrar una cota para los errores de aproximación y compárelos con 
los errores reales. 


Solución Puesto que f(t, у) = y — 1? + 1, tenemos ðf (t, у)/ду = 1 para todas las y, por 
lo que L = 1. Para este problema, la solución exacta es y(t) = (t + 1)? — 0.5е', por lo que 
у”(ї) = 2 — 0.5е' y 


ly"(1)| <0.5e? —2, рага todas las г є [0,2]. 


Por medio de desigualdad en la cota de error para el método de Euler con Л = 0.2, L = 1,y 
М = 0.5е2 – 2 da 


ly; = э] <0.1(0.5e? — 2)(e'i — 1). 
Por lo tanto 
|у(0.2) — wı| <0.1(0.5e? — 2)(е02 — 1) = 0.03752, 
|y(0.4) — w2| <0.1(0.5e? — 2)(e"* — 1) = 0.08334, 


y así sucesivamente. La tabla 5.2 enumera el error real encontrado en el ejemplo 1, junto con 
la cota de error. Observe que aunque se usó la cota verdadera para la segunda derivada de la 
solución, la cota de error es considerablemente superior que el error real, en especial para los 
valores mayores de t. ш 
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Tabla 5.2 


ti 0.2 


0.4 0.6 0.8 10 1.2 14 1.6 1.8 2.0 


Error real 0.02930 
Cota de error 0.03752 


0.06209 0.09854 0.13875 0.18268 0.23013 0.28063 0.33336 0.38702 0.43969 
0.08334 0.13931 0.20767 0.29117 0.39315 0.51771 0.66985 0.85568 1.08264 


Теогета 5.10 


La principal importancia de la fórmula de Іа cota de error determinada en el teorema 5 9 es 
que la cota depende linealmente del tamaño de paso h. Por consiguiente, disminuir el tamaño 
de paso debería proporcionar mayor precisión para las aproximaciones en la misma medida. 

Olvidado en el resultado del teorema 5.9 está el efecto que el error de redondeo repre- 
senta en la selección del tamaño de paso. Conforme h se vuelve más pequeño, se necesitan 
más cálculos y se espera más error de redondeo. Entonces, en la actualidad, la forma de 
ecuación de diferencia 


Wo = Q, 
м =W; +hf (tiwi), para cada i = 0, 1,...,N — 1, 


no se utiliza para calcular la aproximación a la solución у; en un punto de malla +. En su 
lugar, usamos una ecuación de la forma 


uo = о + ôo, 
И+1 = и + hf (ti, ui) + $41, para cada і = 0, 1,... „№ 1, (5.11) 


donde ô; denota el error de redondeo asociado con и;. Al utilizar métodos similares a aquellos 
en la prueba del teorema 5.9 podemos producir una cota de error para las aproximaciones de 
dígitos finitos para y, provistos por el método de Euler. 


Si y(t) denota la única solución para el problema de valor inicial 


y =f(,y) ast<b, у(ау=о, (5.12) 

y Uy, Uy, ... , иу SON las aproximaciones obtenidas de la ecuación (5.11). Si |ô;| < ô para 

cada т = 0, 1,... , N y la hipótesis del teorema 5.9 son aplicables a la ecuación (5.12), en- 
tonces 

1 /hM 8 z 
ti Р < (14) __ 1 $ L(t¡-a) i 
|у@%) E 919 1+ [дое ' (5.13) 
paracadai=0,1,...,N. ш 


La cota de error (5.13) ya no es lineal еп Л. De hecho, puesto que 


se esperaría que el error se vuelva más grande para los valores suficientemente pequeños de h. 
El cálculo se puede usar para determinar una cota inferior para el tamaño de paso h. Si 
E(h) = (hM/2) + (8/h) implica que E'(h) = (M/2) — (8/h?): 


Si А < 4/28/ М, entonces E'(h) < 0 y E(h) disminuye. 
Si h > 1/28/M, entonces E'(h) > 0 y E(h) aumenta. 
El valor mínimo de Е(Л) se presenta cuando 


n=, [2 
=A (5.14) 
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La disminución de h más allá de este valor tiende a incrementar el error total en la aproxi- 
mación. Por lo general, sin embargo, el valor de ô es suficientemente pequeño para que esta 
cota inferior para h no afecte la operación del método de Euler. 


La sección Conjunto de ejercicios 5.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


FEN 5.3 Métodos de Taylor de orden superior 


Puesto que el objetivo de una técnica numérica es determinar aproximaciones precisas con 
mínimo esfuerzo, necesitamos medios para comparar la eficiencia de los diferentes méto- 
dos de aproximación. El primer dispositivo que consideramos recibe el nombre de error de 
truncamiento local del método. 

El error de truncamiento local en un paso específico mide la cantidad por la que la solu- 
ción exacta para la ecuación diferencial falla en cuanto a satisfacer la ecuación de diferencia 
que se usa para la aproximación en ese paso. Esto podría parecer una forma poco probable 
de comparar el error de varios métodos. En realidad queremos saber qué tan bien satisfacen 
las aproximaciones generadas con los métodos la ecuación diferencial, no al revés. Sin em- 
bargo, no conocemos la solución exacta por lo que, en general, no podemos determinarlo y 
el error de truncamiento local servirá de manera adecuada para determinar no sólo el error 
local de un método, sino también el error de aproximación real. 

Considere el problema de valor inicial 


у'=/@,у), a<t<b, у(ау=ов. 
Definición 5.11 El método de diferencia 
wo = Q 
м = Ww; +họ(ti,wi), para cada i = 0, 1,..., № — 1, 


tiene error de truncamiento local 


Yin — Yi + he (ti, у) — Уна — Y 


Ti+1 (h) = п п Q (ti, уг), 
рага cada і = 0, 1,..., № — 1, donde y; y y;+ı denotan la solución de la ecuación dife- 
rencial en t; y f;,¡, respectivamente. ш 


Por ejemplo, el método de Euler tiene error de truncamiento еп el ¡-ésimo paso 


tah) = = — f(t, y), paracadai=0,1,...,N—1. 


Este error es un error local porque mide la precisión del método en un paso específico, 
al suponer que el método era exacto en el paso anterior. Como tal, depende de la ecuación 
diferencial, del tamaño de paso y del paso particular en la aproximación. 

Al considerar la ecuación (5.7) en la sección previa, observamos que el método de Euler 
tiene 

h „ 
Ti+1 (h) = z (&:), рага algunas &; en (t;, t;+1). 
Cuando se sabe que у” (t) está acotada por una constante M еп [a, b], esto implica 


h 
lti+1 (A)| < М, 


por lo que el error de truncamiento local es O(h). 
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Los métodos en esta sección 
utilizan polinomios de Taylor y 
el conocimiento de la derivada en 
un nodo para aproximar el valor 
de la función en un nodo nuevo. 


Ejemplo 1 


Una forma de seleccionar métodos de ecuación de diferencia para resolver ecuaciones 
diferenciales ordinarias de tal forma que sus errores de truncamiento local son O(h”) para un 
valor de p tan grande como sea posible, mientras se mantienen el número y la complejidad 
de los cálculos de los métodos dentro de un límite razonable. 

Puesto que el método de Euler se derivó del teorema de Taylor con n= 1 para aproximar 
la solución de la ecuación diferencial, nuestro primer intento para encontrar métodos para 
mejorar las propiedades de convergencia de los métodos de diferencia es ampliar esta técnica 
de derivación a valores más grandes de n. 

Suponga que la solución y(t) para el problema de valor inicial 


y =f(t,y), ast<b, у(а) =а, 


tiene (n + 1) derivadas continuas. Si ampliamos la solución, y(t), en términos de su enésimo 
polinomio de Taylor alrededor de t; y se evalúan en 1; у, obtenemos 
h2 h” h+! i 
уб) = у(®) + у) + у) + SM IE (5.15) 
2 п! (п + 1)! 


para algunas ё; en (ti, t;+1). 
La diferenciación sucesiva de la solución, y(t), da 


у'@) = /@,у@)), у") = Р, y)  y,engeneral, yP) = FED, yA). 


Al sustituir estos resultados en la ecuación (5.15) obtenemos 


h2 
уйы) = у) + hf ti, Y) + Tie MOETE (5.16) 


n+1 


(n+1)! 


h” na (л) 
Р ЖО, (ti, y(ti)) + PUE yé). 


El método de ecuación de diferencia correspondiente a la ecuación (5.16) se obtiene al 
borrar el término restante relacionado con ё;. 


Método de Taylor de orden n 
Wọ = Q, 
міл =W; +AT™(ti,w;), para cada i = 0,1,...,М№ — 1, (5.17) 
donde 


(n) h 1 =! (п—1) 
Т iwi) = ftw) +z wiet = rI (ti, wi). 


El método de Euler es un método de Taylor de orden uno. 


Aplique el método de Taylor de órdenes a) 2 y b) 4 con N = 10 al problema de valor inicial 
y=y-ť+1, 0<t<2, у(0)=0.5. 


Solución a) Para el método de orden 2, necesitamos la primera derivada de f(t, y(t)) = 
y(t) — 12 + 1 respecto a la variable г. Puesto que y” = y — 1? + 1, tenemos 


1 d 2 / 2 
FEI = Вее м =у—?-+1—2г[, 
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por lo que 
2) h 2 h 2 
Т (tiwi) = fti wi) + z (tiwi) = и +1+ zi = +1—21;) 
h 2 
= 5 (и; = +1) —ht;. 


Puesto que N = 10, tenemos л = 0.2, у t; = 0.21 para сайа і = 1, 2,..., 10. Por lo tan- 
to, el método de segundo orden se vuelve 


Wo =0;5; 
h 2 
Wi = и; А к (и; = 6 +1) — ht 


0.2 o | 
=w; +02 | ( 1+ == ) (w; — 0.041? + 1) — 0.041 


= 1.22w; — 0.008812 — 0.008i + 0.22. 


Los primeros dos pasos dan las aproximaciones 


у(0.2) = wı = 1.22(0.5) — 0.0088 (0)? — 0.008 (0) + 0.22 = 0.83 


Tabla 5.3 y 
Orden 2 у(0.4) = wz = 1.22 (0.83) — 0.0088 (0.2)? — 0.008 (0.2) + 0.22 = 1.2158. 
de Taylor Error 
ti Wi |у(%) —w;] Todas las aproximaciones у sus errores se muestran en la tabla 5.3. 
0.0 0500000 0 b) Para el método de Taylor de orden 4 necesitamos las primeras tres derivadas de 


0.2 0.830000 0000701  F(,y(0)) respecto a t. De nuevo, por medio de y’ = y — t? + 1, tenemos 
0.4 1.215800 0.001712 


0.6 1.652076 0.003135 FEO) =y- +1- 21, 

0.8 2.132333 0.005103 j 

10 2.648646 0007787 РО, Уу) = (у= 2+1 20) = у – 1 – 2 

12 3.191348 0.011407 dt 

14 3.748645 0.016245 =y- +1-2t-2=y-tť —2t-], 


1.6 4.306146 0.022663 
1.8 4.846299 0.031122 у 
20 5.347684 0.042212 


m E E E E Е 2 
J E yH) = 7 (у=1-21- ) = у –- 2-2 = у- і – 21 1, 
por lo que 


(4) ћ h? 7 h? ” 
T (ti, wi) = f (tiwi) + z7 (tiwi) + yÍ (tiwi) + ТА (ti, wi) 


2 h 2 h? 2 
р +1+ 0" +1 2t) + (wi ti — 2t; 5) 


h? 2 
1—12 20 – 1 
тае ) 
h 2 3 „2 
== 1 1 1 ht; 
(пн) i) (5+5) 
h E K 
+1+ = = = – 
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Tabla 5.4 
Orden 4 
de Taylor Error 

ti wi [y (ti) — | 
0.0 0.500000 0 
0.2 0.829300 0.000001 
04 1.214091 0.000003 
0.6 1.648947 0.000006 
0.8 2.127240 0.000010 
10 2.640874 0.000015 
12 3.179964 0.000023 
14 3.732432 0.000032 
16 4.283529 0.000045 
1.8 4.815238 0.000062 
20 5.305555 0.000083 


La interpolación de Hermite 
requiere tanto el valor de la 
función como su derivada 

en cada nodo. Esto crea un 
método de interpolación natural 
para aproximar ecuaciones 
diferenciales ya que estos datos 


están disponibles. 
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Por lo tanto, el método de Taylor de orden 4 es 


Wo = 0.5, 
y еа 
EA ПЫ ido з a)" 
E 5 
SE Рр АВ 
+1+ 6 al 
parai=0,1,...,N—1l. 
Puesto que N = 10 y h = 0.2, el método se vuelve 
os rá 0.2 үз 0.04 E 0.008 ( 0.0412) 
И = №; . 7 6 24 Wi .04i 
0.2 0.04 0.2 0.04 0.008 
1 0.04i)+ 1 
( 02) Drita a A 
= 1.2214w; — 0.008856i? — 0.00856i + 0.2186, 
рага cada i = 0, 1,... ,9. Los primeros dos pasos proporcionan las aproximaciones 


y(0.2) ~ w, = 1.2214(0.5) — 0.008856 (0)? — 0.00856(0) + 0.2186 = 0.8293 


y 
у(0.4) = w2 = 1.2214(0.8293) — 0.008856 (0.2)? — 0.00856 (0.2) + 0.2186 = 1.214091. 


Todas las aproximaciones y sus errores se muestran en la tabla 5.4. 
Compare estos resultados con los del método de Taylor de orden 2 en la tabla 5.3 y ob- 
servará que los resultados de cuarto orden son inmensamente superiores. и 


Los datos de la tabla 5.4 indican que los resultados del método de Taylor de orden 4 son 
bastante precisos en los nodos 0.2, 0.4 y así sucesivamente. Pero suponga que necesitamos 
determinar una aproximación para un punto intermedio en la tabla, por ejemplo, en t = 1.25. 
Si usamos interpolación lineal sobre el método de Taylor de orden 4 para aproximaciones en 
t= 1.2 у = 14, tenemos 


1.25 — 1.4 
1.2— 1.4 


1.25. 1.2 


1.25) м ш 
ыз ( 14—12 


) 3.1799640 + | ) 3.7324321 = 3.3180810. 


El verdadero valor es y(1.25) = 3.3173285, por lo que esta aproximación tiene un error de 
0.0007525, lo cual es alrededor de 30 veces el promedio de los errores de aproximación en 
1.2 y 1.4. 

Podemos mejorar en forma significativa la aproximación por medio de la interpolación 
cúbica de Hermite. La determinación de esta aproximación para y(1.25) requiere aproxima- 
ciones para y'(1.2) y у'(1.4), así como para y(1.2) y у(1.4). Sin embargo, las aproximacio- 
nes para y(1.2) y y(1.4) están en la tabla y las aproximaciones de la derivada están dis- 
ponibles a partir de la ecuación diferencial ya que y'(+) = f(t, y(t)). En nuestro ejemplo, 
y (t) = y(t) — 1? + 1, por lo que 


y (1.2) = y(1.2) — (1.2? + 1 ~ 3.1799640 — 1.44 + 1 = 2.7399640 


y (1.4) = y (1.4) — (1.4)? + 1 ~ 3.7324327 — 1.96 + 1 = 2.7724321. 


El procedimiento de diferencia dividida en la sección 3.4 provee la información en la 
tabla 5.5. Las entradas subrayadas provienen de los datos y las otras entradas utilizan fórmu- 
las de diferencia dividida. 


Tabla 5.5 


Teorema 5.12 
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12 3.1799640 


2.7399640 
12 3.1799640 0.1118825 

27623405 —0.3071225 
14 3.7324321 0.0504580 

27724321 


14 3.7324321 


El polinomio cúbico de Hermite es 


Y(t) = 3.1799640 + (t — 1.2)2.7399640 + (t — 1.2)20.1118825 
+@—12)?( — 1.4)(—0.3071225), 


por lo que 


y (1.25) ~ 3.1799640 + 0.1369982 + 0.0002797 + 0.0001152 = 3.3173571, 


un resultado preciso dentro de 0.0000286. Esto es aproximadamente el promedio de los 
errores en 1.2 y 1.4 y sólo 4% del error obtenido mediante interpolación lineal. Esta mejora 
de la precisión ciertamente justifica los cálculos adicionales requeridos para el método de 
Hermite. 


Si se usa el método de Taylor de orden n para aproximar las solución de 
у'@)=/@,у@)), ast<b, y(a)=a, 
con tamaño de paso Л y si у є C”*![a, b], entonces el error de truncamiento local es O (h”). 


Demostración Observe que la ecuación (5.16) en la página 206 se puede reescribir como 


h2 h” б pr+l w 

ҥш АР, у) – YO MAY) = (E, y En), 

Yiz — Yi — Af (ti, у) ZA yi) 17 Cti, yi) @ ЕЙ”? Gi, у(&)) 
para algunas $; en (t;, ti+1). Por lo que el error de truncamiento es 

O тоа у) = E E; 
h (n +1)! 

para cada ¡=0,1,...,N — 1. Puesto que y € C”*![a,b], tenemos y"+D(f) = 
f™ (t, y(t)), está acotada en [а,Ь] y t;(h) = O(h”), para cadai=1,2,...,N. ш 


La sección Conjunto de ejercicios 5.3 está disponible en línea. Encuentre la ruta de 
acceso en las paginas preliminares. 


WTI | 5.4 Método Runge-Kutta 


A finales de la década de 1800, 
Carl Runge (1856-1927) utilizó 
métodos similares a los que se han 
usado en esta sección para derivar 
varias fórmulas para aproximar 

la solución de problemas de valor 
inicial. 


Los métodos de Taylor descritos en la sección anterior tienen la propiedad deseable de error 
de truncamiento local de orden superior, pero la desventaja de requerir el cálculo y la eva- 
luación de las derivadas de f (t, y). Este es un procedimiento complicado y que toma mucho 
tiempo para la mayoría de los problemas, por lo que los métodos de Taylor rara vez se usan 
en la práctica. 

Los métodos Runge-Kutta tienen el error de truncamiento local de orden superior a los 
métodos de Taylor, pero eliminan la necesidad de calcular y evaluar las derivadas de f (t, y). 
Antes de presentar las ideas detrás de su derivación, necesitamos considerar el teorema de 
Taylor en dos variables. La prueba de este resultado se puede encontrar en cualquier libro 
estándar sobre cálculo avanzado (consulte, por ejemplo, [Fu], p. 331). 
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Teorema 5.13 Suponga que f(t, y) y todas sus derivadas parciales de orden menor o igual an + 1 son con- 


En 1901, Martin Wilhem Kutta 
(1867-1944) generalizó los 
métodos que Runge desarrolló 
en 1895 para incorporar sistemas 
de ecuaciones diferenciales de 
primer orden. Estas técnicas 
difieren ligeramente de lo que en 
la actualidad llamamos métodos 
de Runge-Kutta. 


Ejemplo 1 


tinuas en D =([(t,y)| a <t <b,c < y < 4} y siíto, уо) € D.Para cada (t, y) € D, 
existe é entre t y tọ y y entre y y уо con 


РС, y) = Palt, y) + Ralt, у), 


donde 
пау убод + (10900 40 = зуб э) 
Е = Ti yo) + (t — to) — уо) МА (to, yo) 
+ A) + 
y 


1 п+1 п+1 РЕ А а" у 
= O +l- j 
R, (t, y) = MD! Al j Je to) Q = yo) Эг+ї=/ду7 °? H) н 
j= 


La función P,(t, y) recibe el nombre del enésimo polinomio de Taylor en dos varia- 
bles para la función f cerca de (to, yo), y Ra (t, y) es el término restante asociado con Р, (t, y). 


Determine Р» (7, y), el segundo polinomio de Taylor cerca de (2, 3) para la función 


E-2_Q-3 
4 4 


ЈС, y) =op | cos(2t + y — 7). 


Solución Para determinar Р, (t, y), necesitamos los valores de f y su primera y segunda deri- 
vadas parciales en (2, 3). Tenemos lo siguiente 


(+ —2y?7] EN Г (у = 3)2] 
4 р 4 


Ft, y) = exp | cos(2(t — 2) + (y — 3)) 


F2, 3) = eA сов(4 3 – Т) = 1, 


— 2321 Г — 3)2] 1 
@ 2) ехр 22 E 2) cos(2(t — 2) + (y — 3) 


д 
7 (t, y) = exp | 


+ sena —2)+(у— 3) 


of = 

g 9) =0, 

д — 2)2 —3)°][1 

ШЫ Ц 4 ) |е Q 4 ) |5 3) соѕ(2(7 — 2) 
+ 0-3) +5100 —2) + (у —3У) 

af 


—(Q,3) =0, 
Эу“ ) 
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9? — 2)? — 3)? 9 (1-2? 
e ек| ez : 2) 


x cos(2(t — 2) + (y — 3)) + 2(t — 2) sen(2(t — 2) + (y — 3)| 


д2 f _ 9 
тышак 
qe — 2)? — 3)? 3 — 3)? 
O [ES 
кен -+O -3+ 0 -Dent -2 += 3) 
д2 f _ 
==>; 
y 
Pf Е @— 2)? (y — 3)? (7 – 2)(у – 3) 
[E 
х со5(2(7 — 2) + (y – 3)) + (£ -2 +0- 3) ѕеп(2(7 — 2) + (y — э) 
д? Р 
ко 3)= 2. 
Рог Іо дое, 
Е af of 0-2} д? f 
P(t, y) = f (2,3) + |е –2220,3)+ 0-30 ) + [Be 
3? f G-39f 
+ (JO Е 3 10.3) 
12206292 20624 a? —3)? Е 
= -34 ч 47 ' 


Una ilustración de la precisión de Р» (t, y) cerca de (2,3) se observa en la figura 5.5. 


Figura 5.5 


Pty) = 1-2? 2 


XX) 
XA 
X=, 
==> 


E 
È 


ft, у) = exp {—(t = 2)?/4 — (y — 3)2/4) cos (2t + y — 7) 


212 


CAPÍTULO 5 


= Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


Métodos de Runge-Kutta de orden 2 


El primer paso para deducir un método Runge-Kutta es determinar los valores para 
ау, 01, y бү con la propiedad de que a; f (t + о, y + 61) se aproxima a 


(2) тз h Й 
Т (t, у) = f(t, у) + z (t, y), 


con error no mayor a O(h?), que es igual al orden del error de truncamiento local para el 
método de Taylor de orden 2. Ya que 


d 3 д 
Рб, у) = Fay = И + L, D yO y yYO= Ft, у), 


tenemos 


af f 


т h hð 
T t, у) = ft, у) += Уу У) ЛУ): (5.18) 


2 ді 


Al expandir f(t + ол, y + Ві) en su polinomio de Taylor de grado 1, cerca de (t, y) 
obtenemos 


д 
гй, уй а +аш 270, y) 


д 
F аву +а - Rı(t +1, y + д1), (5.19) 
donde 
2 32 32 2 32 
Rı(t +1, y + Ві) = Er + 0181 TLE + Ф) (5.20) 


para algunas é entre t y t + о y u entre y y y + Ві. 
Al ajustar los coeficientes de f y sus derivadas en las ecuaciones (5.18) y (5.19) obtene- 
mos las tres ecuaciones 


д h д h 
Рб, у): a =l; э) ое еэ): af = 7% y). 


Los parámetros а, от, y Ві son, por lo tanto 


h h 
а = 1, “=z Y В. = 270, у), 


por lo que 


TE) =$ о а у) )=R РЕ y) 
E Peg e д^” куучы ра 


y, a partir de la ecuación (5.20) 


h2 д2 f 
8 дг2 


h? 3? f 


R к" К. (t,y) | = 
! >+у/@,у) ) = дгду 


2 
def 


h? 2 
F ¿Ue y) эу? E и). 


Ejemplo 2 
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Si todas las derivadas parciales de segundo orden de f están acotadas, entonces 


к(а, уну, у) 
1 7? 2 У 


es О‹(Ё?). En consecuencia: 
e El orden de error para este nuevo método es igual al del método de Taylor de orden 2. 


El método de ecuación de diferencia que resulta de reemplazar Т (t, y) en el método 
de Taylor de orden 2 рог f (t + (1/2), y + (h/2) f (t, y)) es un método Runge-Kutta especí- 
fico, conocido como método de punto medio. 


Método de punto medio 


Wo = Q, 
h h : 
ж ы = м; БАЈ tit z Wi t gfw) , parai = 0, 1,..., N — 1. 


Solamente se encuentran tres parámetros en a, f (t + о, y + Ві), y todos son necesa- 
rios para ajustar 72. Por lo que se requiere una forma más complicada para satisfacer las 
condiciones para cualquiera de los métodos de Taylor de orden superior. 

La forma de cuatro parámetros más adecuada para aproximar 


(3) h / h? ГА 
Т бд ФУ) НЫР У) +7 (t, у) 
еѕ 


ai f(t, у) +a ft +оо, y +82 £(t, y), (5.21) 


e incluso con esto, no hay suficiente flexibilidad para ajustar el término 


һ2 [д 2 
І Б] /@, у), 
y 


6 


lo cual resulta en la expansión de (h? /6) f” (t, у). Por consiguiente, lo mejor que se puede 
obtener al usar (5.21) son métodos con error de truncamiento local О(А2). 

Sin embargo, el hecho de que (5.21) tenga cuatro parámetros proporciona una flexi- 
bilidad en su elección, por lo que se puede derivar una serie de métodos O(h?). Uno de 
los más importantes es el método modificado de Euler, que corresponde a seleccionar 
ај = а = 1 уо =ð =h. Éste tiene la siguiente forma de ecuación de diferencia. 


Método modificado de Euler 


wọ = Q, 


h 
иы = Wi + zl iwi) + fig wi БАР, w:))], para 1=0,1,...,N —1. 


Use los métodos de punto medio y modificado de Euler con N = 10, h = 0.2, t; = 0.2i, y 
wo = 0.5 para aproximar la solución de nuestro ejemplo habitual 


y=y-P*+1, 0<t<2, у(0) = 0.5. 
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Tabla 5.6 


Karl Heun (1859-1929) fue 

un profesor de la Technical 
University of Karlsruhe. Presentó 
esta técnica en un artículo 
publicado en 1900. [Heu] 


Solución Las ecuaciones de diferencia producidas a partir de las diferentes fórmulas son 


método de punto medio: и”; = 1.22w; — 0.0088? — 0.008í + 0.218 


y 
método modificado de Euler: у; = 1.22w; — 0.008812 — 0.008í + 0.216, 
Para cada i = 0, 1,... ‚9. Los primeros dos pasos de estos métodos nos dan 
método de punto medio: уу = 1.22(0.5) — 0.0088(0)? — 0.008(0) + 0.216 = 0.826 
y 


método modificado de Euler: w; = 1.22(0.5) — 0.0088(0)? — 0.008(0) + 0.218 = 0.828 


método de punto medio: wz = 1.22(0.828) — 0.0088(0.2)? — 0.008(0.2) + 0.218 
= 1.21136 


método modificado de Euler: и = 1.22(0.826) — 0.0088(0.2)? — 0.008(0.2) + 0.216 


= 1.20692. 

La tabla 5.6 enumera todos los resultados de los cálculos. Para este problema, el método 

de punto medio es superior al método modificado de Euler. п 
Método de Método modificado 
ti y(ti) punto medio Error de Euler Error 

0.0 0.5000000 0.5000000 0 0.5000000 0 
0.2 0.8292986 0.8280000 0.0012986 0.8260000 0.0032986 
0.4 1.2140877 1.2113600 0.0027277 1.2069200 0.0071677 
0.6 1.6489406 1.6446592 0.0042814 1.6372424 0.0116982 
0.8 2:1272295 2.1212842 0.0059453 2.1102357 0.0169938 
1.0 2.6408591 2.6331668 0.0076923 2.6176876 0.0231715 
1.2 3.1799415 3.1704634 0.0094781 3.1495789 0.0303627 
1.4 3.7324000 3.7211654 0.0112346 3.6936862 0.0387138 
1.6 4.2834838 4.2706218 0.0128620 4.2350972 0.0483866 
1.8 4.8151763 4.8009586 0.0142177 4.7556185 0.0595577 
2.0 5.3054720 5.2903695 0.0151025 5.2330546 0.0724173 


Métodos de Runge-Kutta de orden superior 


El término Т)(7, y) se puede aproximar con error О(/?) mediante una expresión de la forma 
fE +a, y+ êf +02, y + 82 РО, у))), 


relacionada con cuatro parámetros y el álgebra implicada en la determinación de &1, 81, 0%2, 
y 82 es bastante tediosa. El método O(h’) más común es el de Heun, dado por 


wo =Q 


иы = +E (Ри) +3 (Р (а 2, + 5° / (ttt, wi tft, w))))), 
para i =0,1,...,N —1. 
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Ilustración Al aplicar el método de Heun con N = 10, h = 0.2, t; = 0.2i, y wo = 0.5 para aproximar 
la solución a nuestro ejemplo habitual 


y=y-*+1, 0O<t<2, у(0) = 0.5, 


da los valores en la tabla 5.7. Observe el error reducido a lo largo del rango sobre las aproxi- 


maciones de punto medio y Euler modificado. E 
Tabla 5.7 Método 
ti y(ti) de Heun Error 

0.0 0.5000000 0.5000000 0 

0.2 0.8292986 0.8292444 0.0000542 
0.4 1.2140877 1.2139750 0.0001127 
0.6 1.6489406 1.6487659 0.0001747 
0.8 2.1272295 2.1269905 0.0002390 
10 2.6408591 2.6405555 00003035 
1.2 3.1799415 3.1795763 00003653 
14 37324000 37319803 0.0004197 
16 4.2834838 4.2830230 0.0004608 
1.8 4.8151763 4.8146966 0.0004797 


20 5.3054720 5.3050072 0.0004648 


En general, los métodos de Runge-Kutta de orden 3 no se usan. El método Runge-Kutta 
que se usa de manera común es de orden 4 en forma de ecuación de diferencia, dado como 
sigue. 


Runge-Kutta de orden 4 


wo = Q, 


kı = hf (ti, wi), 


h 1 
ko =hf ( + у, л + qu). 


h 1 
k3=hf ( + z” + ze). 


Ка = hf (ti+1, wi + Кз), 


1 
иы = Wi + z% + 20 + 2ks + ka), 


para cada į = 0, 1,..., N — 1. Este método tiene error de truncamiento local O(hî), siem- 
pre y cuando la solución у(?) tenga cinco derivadas continuas. Introducimos en el método la 
notación kı, k2, кз, к para eliminar la necesidad de anidado sucesivo en la segunda variable 
de f(t, y). El ejercicio 32 muestra qué tan complicado se vuelve este anidado. 

El algoritmo 5.2 implementa el método Runge-Kutta de orden 4. 


Método Runge-Kutta (orden 4) 
Para aproximar la solución del problema de valor inicial 
y=f(,y) ast<b, y(a)=0, 


en (N + 1) números espaciados equitativamente en el intervalo[a, b]: 


ENTRADA extremos a, b; entero N; condición inicial о. 


SALIDA aproximación w para y en los valores (N + 1) de t. 
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Paso 1 Determine h = (b — a)/N; 
f= ай; 
у = 0; 
SALIDA (тї, у). 
Paso 2 Рага і = 1, 2,... , N haga los pasos 3—5. 


Paso 3 Determine Ку = Af (t, у); 
K = hf (t +h/2,w + K1/2); 
Кз =hf(t +h/2,w + K2/2); 
K4 =hf(t+h,w + Кз). 
Paso 4 Determine w = w + (Kı +2K2 + 2K3 + K4)/6; (calcule у.) 
t =a + ih. (Calcule ti.) 
Paso 5 SALIDA (t,w). 


Paso 6 PARE. 


Ejemplo 3 Utilice el método Runge-Kutta de orden 4 con h = 0.2, N = 10, y t; = 0.2i para obtener 
aproximaciones para la solución del problema de valor inicial 


y=y-t +1, 0<т<2, у(0)=0.5. 
Solución La aproximación para y(0.2) se obtiene mediante 


ио = 0.5 

kı = 0.27 (0, 0.5) = 0.2(1.5) = 0.3 
k2 = 0.27 (0.1, 0.65) = 0.328 

k3 = 0.27 (0.1, 0.664) = 0.3308 

k4 = 0.27 (0.2, 0.8308) = 0.35816 


1 
м = 0.5 + qe + 2(0.328) + 2(0.3308) + 0.35816) = 0.8292933. 


Los resultados restantes y sus errores se muestran en la tabla 5.8. п 


Tabla 5.8 Runge-Kutta 
Exacto orden 4 Error 
ti yi = y (ti) Wi ly: — wil 

0.0 0.5000000 0.5000000 0 

0.2 0.8292986 0.8292933 0.0000053 
0.4 1.2140877 1.2140762 0.0000114 
0.6 1.6489406 1.6489220 0.0000186 
0.8 2.1272295 2.1272027 0.0000269 
1.0 2.6408591 2.6408227 0.0000364 
1.2 3.1799415 3.1798942 0.0000474 
1.4 3.7324000 3.7323401 0.0000599 
1.6 4.2834838 4.2834095 0.0000743 
1.8 4.8151763 4.8150857 0.0000906 


2.0 5.3054720 5.3053630 0.0001089 


Tabla 5.9 


Ilustración 


Tabla 5.10 
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Comparaciones computacionales 


El principal esfuerzo computacional al aplicar los métodos de Runge-Kutta es la evaluación 
de f. En los métodos de segundo orden, el error de truncamiento local es om, y el costo es 
dos evaluaciones de función por paso. El método Runge-Kutta de orden 4 requiere cuatro 
evaluaciones por paso, y el error de truncamiento local es O(h*). Butcher (consulte [But] 
para un resumen) ha establecido la relación entre el número de evaluaciones por paso y el 
orden del error de truncamiento local mostrado en la tabla 5.9. Esta tabla indica porqué los 
métodos de orden menor a cinco con tamaño de paso más pequeño se usan preferentemente 
para los métodos de orden superior por medio de un tamaño de paso más grande. 


Evaluaciones por paso 2 3 4 5<п<7 8<n<9 10 <n 


Mejor error de іш" күл озу owy Ow Oh) Om) 
camiento local posible 


Una medida para comparar los métodos de Runge-Kutta de orden inferior se describe 
como sigue: 


e Mientras el método Runge-Kutta de orden 4 requiere cuatro evaluaciones por paso, el 
método de Euler sólo requiere una evaluación. Por lo tanto, si el método Runge-Kutta 
de orden 4 va a ser superior, deberían proporcionarse respuestas más precisas que las del 
método de Euler con un cuarto del tamaño de paso. De igual forma, si el método Runge- 
Kutta de orden 4 va a ser superior a los métodos de Runge-Kutta de segundo orden, que 
requieren dos evaluaciones por paso, debería proporcionar mayor precisión con un tamaño 
de paso h que un método de segundo orden con un tamaño de paso Л /2. 


Lo siguiente ilustra la superioridad del método Runge-Kutta de cuarto orden por medio 


de esta medida para el problema de valor inicial que hemos considerado. 


Para el problema 
у=у- 2+1, O<t<2, у(0) = 0.5, 


el método de Euler соп л = 0.025, el método de punto medio соп л = 0.05, у el método 
Runge-Kutta de cuarto orden con h = 0.1 se comparan en los puntos de malla comunes de 
estos métodos 0.1, 0.2, 0.3, 0.4, y 0.5. Cada una de estas técnicas requiere 20 evaluaciones 
de función para determinar los valores enumerados en la tabla 5.10 para aproximar y(0.5). 


En este ejemplo, el método de cuarto orden es claramente superior. п 
Ешег Runge-Kutta 
Euler modificado de orden 4 
ti Exacto h = 0.025 h = 0.05 h=0.1 
0.0 0.5000000 0.5000000 0.5000000 0.5000000 
0.1 0.6574145 0.6554982 0.6573085 0.6574144 
0.2 0.8292986 0.8253385 0.8290778 0.8292983 
0.3 1.0150706 1.0089334 1.0147254 1.0150701 
0.4 1.2140877 1.2056345 1.2136079 1.2140869 
0.5 1.4256394 1.4147264 1.4250141 1.4256384 


La sección Conjunto de ejercicios 5.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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7 5.5 Control de error y método Runge-Kutta-Fehlberg 


En la sección 4.6 observamos el uso apropiado de tamaños de paso variables para que las 
aproximaciones de integrales produzcan métodos eficientes. Por sí mismos quizá no fueran 
suficientes para favorecer estos métodos debido al aumento de complicación que surge al 
aplicarlos. Sin embargo, tienen otra característica que les da gran valor. En el procedimiento 
de tamaño de paso se incluye un cálculo del error de truncamiento que no requiere la aproxi- 
А mación de derivadas superiores de la función. Estos métodos reciben el nombre de adapta- 
rara bles porque adaptan el número y la posición de los nodos utilizados en la aproximación para 
adaptable en la sección 4.6 antes 
de considerar este material. garantizar que el error de truncamiento se mantiene dentro de un límite específico. 

Existe una conexión cercana entre el problema de aproximación del valor de una in- 
tegral definida y el de aproximación de la solución de un problema de valor inicial. No es 
sorprendente, entonces, que existan métodos adaptables para aproximar las soluciones de 
los problemas de valor inicial y que estos métodos no sólo sean eficientes, sino también que 
incluyan el control de error. 

Cualquier método de un paso para aproximar la solución, y(t), del problema de valor 
inicial 


Tal vez le gustaría revisar 


y =f(t,y), paraa<t<b, cony(a)=0, 
se puede expresar en la forma 
мг = Wi + hih (ti, wi, hi), parai = 0, 1,..., N – 1, 


para alguna función ф. 
Un método ideal para la ecuación de diferencia 


иы = Wi + hio (ti, wi, hi), i =0,1,...,N-1, 
para aproximar la solución, y(t), del problema de valor inicial 


SEN, a<t<b, у(ау=о, 


tendría la propiedad de que, dada una tolerancia e > 0, un número mínimo de puntos de 
malla se puede usar para garantizar que el error global, |y(t;) — w;|, no exceda e para nin- 
guna i = 0, 1,..., №. No sorprende que tener un número mínimo de puntos de malla y 
también controlar el error global de un método de diferencia sea inconsistente con los puntos 
igualmente espaciados en el intervalo. En esta sección examinamos técnicas que se usan para 
controlar el error de un método de ecuación de diferencia de manera eficiente mediante la 
elección adecuada de puntos de malla. 

A pesar de que, en general, no podamos determinar el error global de un método, en la 
sección 5.10 observaremos que existe una conexión cercana entre el error de truncamiento 
local y el error global. Al utilizar métodos de diferente orden podemos predecir el error de 
truncamiento local y, al usar esta predicción, seleccionar un tamaño de paso que controle al 
error global. 

Para ilustrar la técnica, suponga que tenemos dos técnicas de aproximación. La primera 
se obtiene a partir del método de Taylor de enésimo orden de la forma 


Y (tii) = уп) +AA lti, yY), h) + Oh”) 


y produce aproximaciones con error de truncamiento local т;+1(Л) = O(h”). Éstas son da- 
das por 


м0 =Q 
иы = Wi + һф(ї, wi, Й), para i > 0. 


En general, el método se genera al aplicar la modificación de Runge-Kutta para el método de 
Taylor, pero la derivación específica no es importante. 
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El segundo método es similar, pero de un orden superior; proviene de un método de 
Taylor de (n + 1) orden de la forma 


Y (ti+1) = y(t) + h(t, y(t), h) + о"? 


y produce aproximaciones con el error de truncamiento local ї;ү1(Л) = О(Л"+!). Esto es 
dado por 


wo =Q 
Wi = Wi + һф(ї, wi, h), para i > 0. 


Primero suponemos que w; ~% у(ї;) = ў y seleccionamos un tamaño de paso fijo л para 
generar las aproximaciones w;+1 y Wi+1 to y(t;,1). Entonces 


T;¡+1 (Л) = м) шәй (ti, y(ti), h) 
A iA 
h 
Y iy) — [и + Ag, wi, h)] 


h 


1 
= —(у@ ы) — ры). 
һ 
De manera similar, tenemos 
_ 1 Е 
T;¡41(h) = gO) = Wi+1). 
Como consecuencia, tenemos 


1 
Ti+ı (1) = gO) = м) 


1 
= Обн) = еы) + (Dig — Wi41)] 
1 
= Tis (A) + y Pi = м). 


Pero т;+1(Л) es O(h”) y T,,1 (1) es О(А"+!), por lo que la parte significativa de т;+1(Л) 
debe provenir de 


z (Wi+1 = Wi+1). 


Esto nos da una aproximación que se puede calcular fácilmente para el método de error de 
truncamiento local de O(h”): 


1 
Ti+1 (h) = т (ат = Уры). 


Sea R = }[ў — №11. 

Sin embargo, el objetivo no es simplemente calcular el error de truncamiento local, sino 
ajustar el tamaño de paso para mantenerlo dentro de una cota específica. Para hacerlo, asu- 
mimos que como т; (h) es O(h”), existe un número K, independiente de Л, con 


T;i+1 (h) x КЇ". 
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Erwin Fehlberg desarrolló ésta 

y otras técnicas de control de 
error mientras trabajaba en las 
instalaciones de la NASA en 
Huntsville, Alabama, durante la 
década de 1960. En 1969, recibió 
por su trabajo la medalla por 
logros científicos excepcionales 
de la NASA. 


Entonces, el error de truncamiento local producido al aplicar el método de enésimo 
orden con un tamaño de paso qh se puede calcular a través de las aproximaciones originales 


м Y т: 
п 
q 


т1+1(9ћ) = K(qh)" = q” (Kh") = q” Tizi (h) = z” — Wi+1). 


La cota T;+ı (qh) para e, seleccionamos q de tal forma que 
n 


raul = м | ~ |ti} (qh)| < e, 


es decir, tal que 


h 1/п 1/п 
q< (ә) = (5). (5.22) 
Pis — ие R 


Método Runge-Kutta-Fehlberg 


Una técnica popular que usa la desigualdad (5.22) para control de error es el método Runge- 
Kutta-Fehlberg (consulte [Fe].) Esta técnica utiliza el método Runge-Kutta con error de 
truncamiento local de orden 5, 


16 k 6656 28561 9 


2 
фы = Wi К k Кв, 
Wi = Wi + 3540 + 7358 + 56430 — 50% + 55 6 


para calcular el error local en un método Runge-Kutta de orden 4 dado por 


+2, , 108, ү 2197, 1 
Witi = Wi t A ° T 410447 5 


ks, 


donde los coeficientes de las ecuaciones son 


kı = hf (ti, wi), 


h 1 
k=hf |ti tw +k], 
2 (онда) 


Кз = і та ТЕВЕ" 
3=hf i grrr 32“! 39 > 


Ил, , 1932 7200, | 1296, 
PE сту, t 197% = 2197/2 + 31978 )> 


3680 845 
216 513 4104)” 


439 
ks =hf ti +h,wi + kı 8k2 + k3 


ПНР СРС: Bop 354, , 1859, П 
s=hf |ti t z Wi- RAR AA a a) 


Una ventaja de este método es que sólo se requieren seis evaluaciones de f por paso. Los 
métodos arbitrarios de Runge-Kutta de órdenes 4 y 5, utilizados juntos (consulte la tabla 5.9 
en la página 217) requieren por lo menos cuatro evaluaciones de f para el método de cuarto 
orden y un sexto adicional para el método de quinto orden, para un total de por lo menos 10 
evaluaciones de función. Por lo que el método Runge-Kutta-Fehlberg tiene al menos 40% 
de disminución en el número de evaluaciones de función sobre el uso de un par de métodos 
arbitrarios de cuarto y quinto orden. 

En la teoría de control de error, un valor inicial de л en el ¿-ésimo paso se usa рага en- 
contrar los primeros valores de у; і y W;+1, 10 cual conduce a la determinación de q para 
ese paso y, entonces, se repiten los cálculos. Este procedimiento requiere el doble de evalua- 
ciones de función por paso sin control de error. En la práctica, el valor de q que se utilizará 
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se selecciona de una forma diferente con el fin de hacer que el costo de la evaluación de 
función incrementado valga la pena. El valor de q determinado en el ¡-ésimo paso se utiliza 
para dos propósitos: 


e Cuando R > e, rechazamos la selección inicial de h en el ¡-ésimo paso y repetimos 105 
cálculos mediante qh y 


e Cuando R < e, aceptamos el valor calculado en el ¡-ésimo paso mediante el tamaño de 
paso h, pero cambiamos el tamaño de paso para qh para el (i + 1) paso. 


Debido a la desventaja en términos de evaluaciones de función que se debe pagar si los pasos 
se repiten, q tiende a ser seleccionado de manera conservadora. De hecho, para el método 
Runge-Kutta-Fehlberg con n = 4, una elección común es 


h 1/4 h 1/4 ijn 
q= (2) = 0.84 (е) = 0.84 (5) | 
2 1Wi41 — Wip] [а = ме] К 


En el algoritmo 5.3 para el método Runge-Kutta-Fehlberg, se añade el paso 9 para eliminar 
grandes modificaciones en el tamaño de paso. Esto se hace para no pasar demasiado tiempo 
con tamaños de paso pequeños en regiones con irregularidades en las derivadas de y y para 
evitar tamaños de paso grandes, lo cual puede resultar en la omisión de regiones sensibles 
entre los pasos. El procedimiento de incremento del tamaño de paso se puede evitar por 
completo a partir del algoritmo y el procedimiento de disminución del tamaño de paso que 
se usa sólo cuando sea necesario para controlar el error. 


Método Runge-Kutta-Fehlberg 
Para aproximar la solución del problema de valor inicial 


у= }(,у), ast<b, у(а) =а, 
con error de truncamiento local dentro de una tolerancia determinada: 
ENTRADA extremos а, b; condición inicial о; tolerancia TOL; tamaño de paso máximo 
hmáx; tamaño de paso mínimo hmín. 


SALIDA +, у, л, donde w se aproxima a y(1) y se utiliza el tamaño de paso h o un mensaje 
de que se excede el tamaño mínimo de paso. 


Paso 1 Determine t = a; 


w = 0; 
h = hmáx; 
FLAG = 1; 
SALIDA (t, w). 


Paso 2 Mientras (FLAG = 1) haga los pasos 3-11. 
Paso З Determine Kı = Af (t, у); 
Ko=hf (+ 3h, w+3K1); 


K3=hf (14 ¿h,w+¿K1+2%Ko); 

Ka =hf (t+ Bh w + 3597 K1 — 3597 K2 + 2197 Кэ); 

Ks=hf (t+h,w + 52 Ку — 8К + L9 Кз — 5 Ка); 
Ko=hf (t+ 4h,w — ¿K1+2K3- 4 K; + B? Ка — E Ks). 
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А 11 _ 128 р 2197 1 2 
Paso 4 Determine R = |5 Ку — prs Кз — 7579 K4 + 59 К5 + Кв). 


(Nota: К = }|ў ца = Wisil А |т+1(Л)|) 
Paso 5 SiR < TOL entonces haga los pasos 6 y 7. 


Paso 6 Determine t =t + л; (aproximación aceptada.) 


_ 25 1408 2197 + _1 
w =w + 576 КІ + 5565 Кз + 7104 Ка — 5Ks- 


Paso 7 SALIDA (t,w,h). (Fin del paso 5) 
Paso 8 Determine 8 = 0.84(ТОІ/К)!/*. 


Paso 9 51 8 < 0.1 entonces haga A = 0.1л 
también si $ > 4 entonces haga h = 4h 
sino haga Л = ёл. (Calcular h nueva.) 


Paso 10 Sih > hmáx entonces haga h = hmáx. 


Paso 11 Sit > b entonces haga FLAG = 0 
también si t + h > b entonces haga h = b — t 
también si h < hmín entonces 
determine FLAG = 0; 
SALIDA (‘h mínima excedida”). 
(Procedimiento completado sin éxito.) 
(Fin del paso 3) 


Paso 12 (El procedimiento está completo.) 
PARE. 


Ejemplo 1 Utilice el método Runge-Kutta-Fehlberg con una tolerancia TOL = 1075, un tamaño de paso 
máximo hmáx = 0.25, un tamaño de paso mínimo hmín = 0.01 para aproximar la solución 
del problema de valor inicial 


у=у- +1, 05152, y(0)=05, 
y compare los resultados con la solución exacta y(t) = (t + 1) —0.5e*. 


Solución Trabajaremos a través del primer paso de los cálculos у, a continuación, aplicare- 
mos el algoritmo 5.3 para determinar los resultados restantes. La condición inicial da fọ = 0 
y Wo = 0.5. Para determinar у mediante w; usando h = 0.25, el tamaño de paso máximo 
permisible, calculamos 


kı = hf (to, wo) = 0.25 (0.5 — 0? + 1) = 0.375, 


1 1 1 1 
К =hf (o + д” wo + ди) = 0.25} (4025, 0.5 + ¿0375) = 0.3974609, 


k3=Hf| t F de 
3=hf o + gh, wo 391 + зэ? 


3 9 
= 0.25} (0.09375, 0.5 + зр т? + 1503974609) = 0.4095383, 


або а Bn оа. Ї932ь, _ 7200р, 7296 
а b + тул, Wo + тоу — 21972 + 21976 
1932 7200 7296 
=00 2307692, 0.5 + 220.375 — 0.3974 12204095383 
0 sz (0 07692, 0.5 + 7250.375 — 51g7?3974609 + 57 ) 


= 0.4584971, 
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439 
ks = hf | to + h, wo + kı = 8k2 + 


3680 845 
216 ETE 


k k 
3 4104 * 


439 3680 845 
= 0.25 f (0.25, 0.5 + 20.375 — 8(0.3974609) + е = a SAN 


216 104 
= 0.4658452, 

у 

ol Ж Bop 35, , 1859, П 

6 = Af [to + 2, мо >й +2Юю— с. + mo“ — 4055 


=0.25f [0.125, 0.5 $ 0.375 + 2(0.3974609) a 4095383 + 90 4584971 
Е МЕИ | 2565 ` 4104 ` 


11 
— —0.4658452 
40 ) 


= 0.4204789. 


Entonces, se encuentra que las dos aproximaciones para y(0.25) son 


16 6656, 2856, 9, 2, 
135 1282575 56430^ 507 55 


wi = wo + 


16 6656 28561 9 
= 0.5 + — 0.375 + ———0.4095383 + ———0.4584971 — —0.4658452 
135 12825 56430 50 


2 
—0.4204789 
+ 55 


= 0.9204870, 
y 
TETS 25 Hi PO + 2197 Я Li 
216 2565 ` 4104 Э 
= 0.5 + 25 0.375 + 1408 4095383 + 2197 0,4584971 Е 10.4658452 
216 2565 4104 5 
= 0.9204886. 


Esto también implica que 


PE [л 128 2197 а а 24 
0.25 |360 | 4275 75240" 50° ' 55 6 
1 128 2197 
=4|———0.375 0.4095383 — ————0.4584971 
360 4275 75240 


50 
= 0.00000621388, 


1 2 
+ ——0.4658452 + 5504004789 


—0.84 ( £ y к A um 0.9461033291 
IZ INR "NL o0.00000621388) — 
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Puesto que А < 107%, podemos aceptar la aproximación 0.9204886 para y(0.25), pero 
deberíamos ajustar el tamaño de paso para la siguiente iteración рага л = 0.9461033291 
(0.25) ~ 0.2365258. Sin embargo, sólo se esperaría que los primeros cinco dígitos de este 
resultado sean precisos porque R tiene solamente cinco dígitos de precisión. Puesto que 
estamos restando efectivamente los números casi iguales w; y ў; cuando calculamos R, 
existe una buena probabilidad de error de redondeo. Ésta es una razón adicional para ser 
conservador al calcular q. 

Los resultados a partir del algoritmo se muestran en la tabla 5.11. El incremento de 
precisión se ha usado para garantizar que los cálculos son precisos para todos los lugares 
listados. Las últimas dos columnas en la tabla 5.11 muestran los resultados del método de 
quinto orden. Para valores pequeños de т, el error es menor al error en el método de cuarto 


orden, pero supera el del método de cuarto orden cuando f aumenta. п 
Tabla 5.11 
RKF-4 RKF-5 

ti Yi = y(t;) Wi hi Ri ly: — w:l wi ly: — | 

0 0.5 0.5 0.5 
0.2500000 0.9204873 0.9204886 0.2500000 6.2 х 107% 1.3 х 107% 0.9204870 2.424 х 1077 
0.4865522 1.3964884 1.3964910 0.2365522 4.5 х 107% 2.6 х 107% 1.3964900 1.510 х 105% 
0.7293332 1.9537446 1.9537488 0.2427810 4.3 х 107% 4.2 х 107% 1.9537477 3.136 х 107% 
0.9793332 2.5864198 2.5864260 0.2500000 3.8 х 1070 6.2 х 107% 2.5864251 5.242 х 1070 
1.2293332 3.2604520 3.2604605 0.2500000 2.4 х 107% 8.5 x 107% 3.2604599 7.895 х 1076 
1.4793332 3.9520844 3.9520955 0.2500000 7x107 1.11 x 107 3.9520954 1.096 х 1075 


1.7293332 4.6308127 4.6308268 0.2500000 1.5 х 1076 1.41 х 1075 4.6308272 1.446 х 107? 
1.9793332 5.2574687 5.2574861 0.2500000 4.3 х 107 1.73 х 1075 5.2574871 1.839 х 1075 
2.0000000 5.3054720 5.3054896 0.0206668 1.77 х 1075 5.3054896 1.768 х 1075 


La sección Conjunto de ejercicios 5.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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Los métodos que se han analizado hasta este punto en el capítulo reciben el nombre de 
métodos de un paso porque la aproximación para el punto de malla t;+ı involucra infor- 
mación de un solo punto de malla previo t;. A pesar de que estos métodos podrían utilizar 
la información de evaluación de función en los puntos entre f; у t;+1, по la retienen para uso 
directo en aproximaciones futuras. Toda la información que se ha usado con estos métodos 
se obtiene dentro del subintervalo sobre el que la solución se aproxima. 

La solución aproximada está disponible en cada uno de los puntos de malla fo, ti, ... , ti 
antes de obtener la aproximación en t;+1, y porque el error |w; — y(t;)| tiende a incrementar 
con j, por lo que parece razonable desarrollar métodos que usen datos previos más precisos 
al aproximar la solución ї;+1. 

Los métodos que utilizan la aproximación en más de un punto de malla previo para 
determinar la aproximación en el siguiente punto reciben el nombre de métodos multipasos. 
A continuación se presenta la definición precisa de estos métodos, junto con la definición de 
los dos tipos de métodos multipasos. 


Definición 5.14 


Las técnicas de Adams-Bashforth 
se deben a John Couch Adams 
(1819-1892), quien realizó 
trabajos significativos en 
matemáticas y astronomía. 
Desarrolló estas técnicas 
numéricas para aproximar la 
solución de un problema de 

flujo de fluido propuesto por 
Bashforth. 


Forest Ray Moulton (1872-1952) 
estaba a cargo de balística en 
Aberdeen Proving Grounds 

en Maryland durante la Primera 
Guerra Mundial. Era un autor 
prolífico, escribió numerosos 
libros sobre matemáticas y 
astronomía y desarrolló métodos 
multipasos para resolver 
ecuaciones balísticas. 


Ejemplo 1 
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Un método multipasos de paso m para resolver el problema de valor inicial 


y =f(,y) ast<b, у(а) =а, (5.23) 


tiene una ecuación de diferencia para encontrar la aproximación у; en el punto de malla 
(¡+1 representado por la siguiente ecuación, donde т es un entero mayor que 1: 


Wi+1 = Am-1W¡ + Am-2W¡-1 3 А аит (5.24) 
+ Albm f @+1› Wi+1) + m1 f (ti, wi) 
pornp bo f (ti41—m; Wi+1—m)], 
para i = m—1,m,...,N—1, donde h = (b—a)/N, ао, a1, ... ,Am-1Y dbo,b1,... , Om son 
constantes y se especifican los valores iniciales específicos 
wo =Q, wi = 01, w2 = 02, эз, Wm-1 = ©т-—1 
Son especificados н 


Cuando bm = 0, el método recibe el nombre de explícito, o abierto, уа que la ecuación 
(5.24) proporciona w;+ı de manera explícita en términos de valores previamente determina- 
dos. Cuando bm Æ 0, , el método recibe el nombre de implícito, o cerrado, porque и; se 
presenta en ambos lados de la ecuación (5.24), por lo que и; solamente se especifica de 
manera implícita. 

Por ejemplo, las ecuaciones 


wo =Q, W=0Q], №2 = 02, W3 = аз, 


h 
иы =w; + z4 PSS Gi wi) — 59 f (ti—z1, м1) + 37 f (ti-2, иго) — 9 f (ti—3, wi—3)], 
(5.25) 


para cada і =3,4,... , N—1, definen el método explícito de cuatro pasos conocido como 
técnica Adams-Bashforth de cuarto orden. Las ecuaciones 


о = Q, Wi = Q], wa = 02, 


h 
“ы = Wi + zg PS 0+, И-ы) + 19 F (ti, wi) 5 ft 1, WD) + f (ti-2, Wi-2)], 
(5.26) 


рага cada i = 2, 3,..., N — 1, definen un método implícito de tres pasos conocido como la 
técnica de Adams-Moulton de cuarto orden. 

Los valores iniciales ya sea en la ecuación (5.25) como en la ecuación (5.26) deben 
especificarse, en general, al suponer wọ = о y generar los valores restantes ya sea con el 
método Runge-Kutta o el método de Taylor. Observaremos que, en general, los métodos 
implícitos son más precisos que los explícitos, pero para aplicar directamente uno implícito 
como el (5.25), debemos resolver la ecuación implícita para у. Esto no siempre es posible 
e incluso cuando se puede hacer, la solución para w;,1 puede no ser única. 


En el ejemplo 3 de la sección 5.4 (consulte la tabla 5.8 en la página 216), usamos el método 
Runge-Kutta de orden 4 con Л = 0.2 para aproximar soluciones para el problema de valor 
inicial 

0<t<2, 


y=y-P+1, y(0) =0.5. 
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Adams estaba especialmente 
interesado en usar esta habilidad 
para los cálculos numéricos 
precisos en la investigación 

de las órbitas de los planetas. 
Predijo la existencia de Neptuno 
al analizar las irregularidades 

en el planeta Urano y 

desarrolló numerosas técnicas 
de integración numérica para 
aproximar la solución de las 
ecuaciones diferenciales. 


= Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


Se encontró que las primeras cuatro aproximaciones son y(0) = wy = 0.5, y(0.2) = 
ит = 0.8292933, y(0.4) = wz = 1.2140762, y y(0.6) == w3 = 1.6489220. Úselas como 
valores iniciales para el método Adam-Bashforth de cuarto orden para calcular nuevas apro- 
ximaciones para y(0.8) y y (1.0) y compárelas con las producidas mediante el método Runge- 
Kutta de cuarto orden. 


Solución Para el método Adam-Bashforth de cuarto orden, tenemos 
0.2 
y (08) ~ жа = ws + 7 (55 (0.6, w3) — 59 f (0-4, w2) + 37 f (0.2, w1) — 9/00, w0)) 


0.2 
= 1.6489220 + эд 22700-6, 1.6489220) — 59 f (0.4, 1.2140762) 


+ 37 f (0.2, 0.8292933) — 9 f (0, 0.5)) 
= 1.6489220 + 0.0083333(55(2.2889220) — 59(2.0540762) 
+ 37(1.7892933) — 9(1.5)) 
= 2.1272892 


y 


0.2 
y(LO) ~ w5 = w4 + 57 (55/ 0.8, w4) — 59 f (0.6, юз) + 37 f (0.4, w2) — 9 f (0.2, w1)) 


0.2 
= 2.1272892 + ад AOS 2.1272892) — 59 f (0.6, 1.6489220) 


+ 37 f (0.4, 1.2140762) — 9 f (0.2, 0.8292933)) 
= 2.1272892 + 0.0083333(55(2.4872892) — 59(2.2889220) 
+ 37(2.0540762) — 9(1.7892933)) 
= 2.6410533. 


El error para estas aproximaciones en т = 0.8 ут = 1.0 son, respectivamente, 


|2.1272295 — 2.1272892| = 5.97 x 107° y |2.6410533 — 2.6408591| = 1.94 х 107. 


Las aproximaciones correspondientes tienen los errores 
[2.1272027 — 2.1272892| = 2.69 х 107° y |2.6408227 — 2.6408591| = 3.64 х 1075. 
m 


Para comenzar la deducción de un método multipasos observe que la solución para el 
problema de valor inicial 


y = ft, y), 


si se integra sobre el intervalo [ї;, £;+1], tiene la propiedad de que 


ast<b, у(а) =а, 


1+1 1+1 
уйы) —у@) = f yH a= | fE, у@)) dt. 


Por consiguiente, 


ti+1 
yt) =y 0) + I Ра ya) а. (5.27) 


Tabla 5.12 
1 
k / En (7) ds 
0 k 
0 1 
1 
1 _ 
2 
5 
2 nG 
12 
3 
3 22 
8 
251 
4 а 
720 
5 
5 95 
288 
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Sin embargo, no podemos integrar f (t, y(t)) sin conocer y(t), la solución del proble- 
ma, por lo que, en su lugar, integramos un polinomio interpolante P(t) рага f (t, у(0)), 
uno que está determinado por algunos de los puntos de datos previamente obtenidos 
(to, Wo), (ti, w1),... , (0, у”). Cuando suponemos, además, que у(ї;) œ% w; la ecuación 
(5.27) se convierte en 


ti+1 
yadawi f P(t) dt. (5.28) 
ti 


A pesar de que ninguna forma de polinomio de interpolación se puede usar para la deriva- 
ción, es más conveniente utilizar la fórmula de diferencia regresiva porque esta forma incor- 
pora con mayor facilidad los datos calculados más recientemente. 

Para derivar una técnica de m pasos de Adam-Bashforth, formamos el polinomio de 
diferencia regresiva Р, (7) con 


(1, FICA) ias Pra Y DY) б-т f (биет, Y (li 1m))). 


Puesto que P;, (7) es un polinomio de interpolación de grado т — 1, existe algún número ё; 
en (ti+1—m, ti) con 


FC, y (1)) = Рһ—1(@) + 


(т) үе. А 
ы к lt 
т. 


Al introducir la sustitución de la variable, t = t; + sh, соп dt = h ds, еп Р„—\(ї) y el 
término de error implica que 


т—1 


FE, yO) dt = J "Su Ө VE F Cti, YD) а 
ti k=0 


ti+ (т) (g. S 
+/ al Ey 6d) 


ti+1 


Jti 


t= 1) — tia) lt — fi41-m) dt 
m! 


т—1 


1 = 
=Y Vse yed" f ( `) ds 
o (k 


k=0 


дт 


1 
/ (з +D (з + т — Df E, yE) ds. 
0 


Las integrales (—1)* | (2) para diferentes valores de k se evalúan fácilmente y son listadas 
en la tabla 5.12. Por ejemplo, cuando k = 3, 


с» P ds = y MAS аш 
e a А 1.2.3 
1 


Por consiguiente, 


li+1 1 5 
Ft, y) dt =h К y (11) + MAS y(ti)) + 07/0 y (11) + | 


ti 


h”+! 
+ 


1 
/ ss+D-6+m-DI ME yE) ds. (5.29) 
0 


228 CAPÍTULO 5 = Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


Puesto que 5(5 +1)---(s +m — 1) no cambia de signo en [0, 1], el teorema de 
valor medio ponderado para integrales se puede usar para deducir que para algún número 
ui, donde +1—т < Hi < ti+1, el término de error en la ecuación (5.29) se convierte en 


h”+! 


m! 


al 
/ se ++1)--- Ет 1)/®9(&, у(&)) de 
0 


Е ИЫ: 
Е т! 


1 

f sís+1)---(s +m – 1) ds. 
0 

Por lo tanto, el error en la ecuación (5.29) se simplifica en 


1 ж; 
А"! Р Cui, y MN) ED [ G) ds. (5.30) 


Sin embargo y(t;,1) — y(t) = pe f(t, y(t)) dt, por lo que la ecuación (5.27) se puede 
escribir como 


1 3 
уйы) = yti) +h | fti, yt) + MAS y(ti)) + URLS УЧ) +. 


t = 
ON | #| ds. pa 


Ejemplo 2 Use la ecuación (5.31) соп m = 3 para derivar la técnica de Adams-Bashforth de tres pasos. 


Solución Tenemos 


1 5 
уй) Y yti) +h С y (11) + MAS y(ti)) + MELO 09) 


1 
= y (1) + по, y(ti)) + zl ti у(@%)) = Fi, у@Ч—1))] 


Э 
+ p y) = 2f ti-1, Ylti-1)) + Ро, y) 


lí 
= y(t) + 1503/0. УЧ) = 16 f (01, у(%—1)) + 5f (0-2, у(%—2))]. 


El método Adams-Bashforth de tres pasos es, рог consiguiente, 


parai=2,3,...,N – 1. и 


Los métodos multipasos también se pueden derivar por medio de Іа serie de Taylor. Un 
ejemplo del procedimiento implicado se considera en el ejercicio 17. Una derivación por 
medio del polinomio de interpolación de Lagrange se analiza en el ejercicio 16. 

El error de truncamiento local para métodos multipasos se define de manera análoga 
al del método de un paso. En el caso de los métodos de un paso, el error de truncamiento 
local provee una medida de la forma en la que la solución de la ecuación diferencial no logra 
resolver la ecuación de diferencia. 


Definición 5.15 Si y(t) es la solución al problema de valor inicial 


у'= /@,у), a<t<b, у(ау=о, 


Ejemplo 3 
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Wi+1 = Am-1W¡ + Am-2W¡-1 + + a0Wi+1—m 
+ Ар f (ti+1, Wi+1) + bm-1 f (ti, Wi) +--+ + bo f (ti+1-m, Wi+1=m)) 


es el (1 + 1)-ésimo paso en un método multipasos, el error de truncamiento local en este 
paso es 


ti — Am- у= 40 fi+1—m 
йе y (ti41) 1y( А 0Y (ti+1—m) (5.32) 
= [р РО, Y id) +++ +++ ро iris Y iitim 
рага сайат = m — 1,m,...,N — 1. ш 


Determine el error de truncamiento local para el método Adams-Bashforth de tres pasos 
derivado en el ejemplo 2. 


Solución Al considerar la forma del error provisto en la ecuación (5.30), la entrada adecua- 
da en la tabla 5.12, da 


= 3h* 
AS / o ds = LO Qu, yu). 


A través del hecho de que f® (mi, у(ш)) = y Y (ui) y la ecuación de diferencia derivada 
en el ejemplo 2, tenemos 


+1) — y 1 
PIO 2 розу уш) — 16-1, у@—1)) + 5S (2, yG- 


Ti+ı (h) = 


1 [3% 


== Y (3) = 3h3 (4) 
=> + (ш. y (ui) | = 3? (ui), para algunos м; € (72, fi41). La 


Métodos explícitos de Adams-Bashforth 
Algunos de los métodos explícitos de Adams-Bashforth, junto con sus valores iniciales y 
errores de truncamiento local requeridos, son los siguientes. La derivación de estas técnicas 
es similar al procedimiento en los ejemplos 2 y 3. 
Método explícito de dos pasos de Adams-Bashforth 

о = Q, wi = 01, 


h 
иы = и: + ¿BF и) = РО, wi-1)l, (5:33) 


donde i = 1, 2,..., N — 1. El error de truncamiento local es т;1(Л) = Sy nr, para 
algunos ш Є (01, т). 


Método explícito de tres pasos de Adams-Bashforth 


h 
мт = И + 112370 wi) — 16 (01, иг 1) +5 f ( —э, Wi-2)], (5.34) 


donde і = 2, 3,..., N — 1. El error de truncamiento local es т;1(Л) = DO (NI, para 
algunos u; Є (2, т). 
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Método explícito de cuatro pasos de Adams-Bashforth 
wo =Q, Wi =Q1, №2 = 0, W3 = 03, 
h 
ишы = иг + 4192/0: wi) — 59 (01, Wi—1) + 37 (2, W¡-2) — 9 f (ti-3, w¡-3)1, 


(5.35) 


donde i = 3, 4, ... , N — 1. El error de truncamiento local es 1;,1 (A) = Sy (aya, para 


algunos p; Є (01-3, ti+1). 
Método explícito de cinco pasos de Adams-Bashforth 


wo =œ, Wi = 0], W2 =02, W3 = 03, W4 = 04, 


h 
иы = Wi + 7201190170, wi) — 2774 f (ti—1, Wi—1) 


+ 2616 f (t;-2, Wi—2) — 1274 f (ti—-3, wi-3) + 251 f (ti—4, w¡-4)l, (5.36) 


donde і = 4, 5,... , N — 1. El error de truncamiento local es т; (4) = 33) O (u:)hž, para 
algunos ш; Є (4, ti+1). 


Métodos implícitos de Adams-Moulton 


Los métodos implícitos se derivan a través de (f;+1, f (ti+1, У (ti+1))) como un nodo de inter- 
polación adicional en la aproximación de la integral 


ti+1 
/ f, уй) а. 
ti 
Algunos de los métodos implícitos más comunes son los siguientes. 
Métodos implícitos de dos pasos de Adams-Moulton 
Wo = Q, р = Q], 
h 
мт = Wi + pPI, иы) +84 (ш, wi) — f (ti-1, 71), (5.37) 


donde і = 1, 2,..., N — 1. El error de truncamiento local es t;+ı (A) = =4y% (mi)h?, 
para algunos ш; € (ti—1, ўкі). 


Métodos implícitos de tres pasos de Adams-Moulton 


(5.38) 


donde і = 2,3, ... , N — 1. El error de truncamiento local es t;41ı (h) = — 2 уб) (uh, 


7207 
para algunos ш; € (ti-2, ti41). 


Ejemplo 4 
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Métodos implícitos de cuatro pasos de Adams-Moulton 


wo 0, W—=0], м2 = 0, W3 = 03, 


h 
иы = Wi + 321251 f (+1, ы) + 646 f (ti, wi) — 264 f @—1, wj-1) 


720 
+ 106 f (t;-2, W¡-2) — 19 f (8-3, w;¡-3)l, (5.39) 
donde і = 3, 4,..., № — 1. El error de truncamiento local es 7;,¡(4) = — gy © un, 


para algunos ш; € (ti—3, ti41). 

Es interesante comparar un método explícito de Adams-Bashforth de m pasos con un 
método implícito de Adams-Moulton de (m — 1) pasos. Ambos implican evaluaciones de f 
por paso y ambos tienen términos y"+D (1¿)h” en sus errores de truncamiento local. En 
general, los coeficientes de los términos relacionados con f en el error de truncamiento local 
son más pequeños para los métodos implícitos que para los explícitos. Esto conduce a una 
mayor estabilidad y errores de redondeo más pequeños para los métodos implícitos. 


Considere el problema de valor inicial 
y=y-2+1, 0O<t<2, у(0) = 0.5. 


Utilice los valores exactos proporcionados рог y(t) = (t + 1)? — 0.5e* como valores inicia- 
les y h = 0.2 para comparar las aproximaciones a partir de a) el método explícito de cuatro 
pasos de Adams-Bashforth y b) el método implícito de tres pasos de Adams-Moulton. 


Solución а) El método Adams-Bashforth tiene la ecuación de diferencia 
h 
иы = и: + z4 PSS ti wi) = 59 (бел, м1) +37 f (t¡-2, w¡-2) — 9 f (1-3, Wi=3)]; 


рага і =3,4,...,9. Al simplificar mediante f(t, y) = y — t +1,h=0.2, y t; = 0.21, 
se convierte en 


1 
ы = ОД?! = 11.8;_1 +7.4w;-2 — 1.825 10:19212 — 0.192? + 4.736]. 
b) El método Adams-Moulton tiene la ecuación de diferencia 


h 
Wip = Wi + zg OS 0+, мг) + 19 F(t, wi) 5 ft 1, WD) + f (ti-2, Wi-2)], 


para i = 2, 3,... ‚9. Esto se reduce a 
1 
Wii = zg ll 8w +27.8w; — wi-1 0.2054 — 0.192i? — 0.192i + 4.736]. 


Para usar este método de manera explícita, necesitamos resolver explícitamente la ecua- 
ción para у; ү. Esto nos da 


Wi+1= 52510278 — w;¡-1 +0.2w;-2 — 0.1921? — 0.1921 + 4.736], 
parai=2,3,...,9. 

Los resultados en la tabla 5.13 se obtuvieron a partir de valores exactos de 
yt)= (t+ 1)? — 0.5е' para о, от, ах y озеп el caso explícito de Adams-Bashforth y para 
а, оу y ол en el caso implícito de Adams-Moulton. Observe que el método Adams Moulton 
proporciona resultados consistentemente mejores. ш 
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Tabla 5.13 


Adams- Adams- 
Bashforth Moulton 
ti Exacto Wi Error Wi Error 
0.0 0.5000000 
0.2 0.8292986 
0.4 1.2140877 
0.6 1.6489406 1.6489341 0.0000065 
0.8 2.1272295 2.1273124 0.0000828 21272136 0.0000160 
10 2.6408591 2.6410810 00002219 2.6408298 0.0000293 
12 3.1799415 3.1803480 0.0004065 3.1798937 0.0000478 
1.4 3.7324000 3.7330601 0.0006601 37323270 0.0000731 


1.6 4.2834838 4.2844931 0.0010093 4.2833767 0.0001071 
1.8 4.8151763 4.8166575 0.0014812 4.8150236 0.0001527 
2.0 5.3054720 5.3075838 0.0021119 5.3052587 0.0002132 


Métodos indicador-corrector 


En el ejemplo 4, el método Adams—Moulton da mejores resultados que el método explícito 
de Adams—Bashforth del mismo orden. A pesar de que, en general, es el caso, los métodos 
implícitos tienen la debilidad inherente de tener que convertir primero el método de manera 
algebraica para una representación explícita de w;,¡. Este procedimiento no siempre es po- 
sible, como se observa al considerar el problema fundamental de valor inicial 


y =e, 0<t<025, y(0)=1. 


Puesto que f(t, y) = e”, el método de tres pasos de Adams—Moulton tiene 
Wi] = Wi + P + 19е"! — 5e”i-1 + e"i-2] 


como ecuación de diferencia y esta ecuación no se puede resolver de manera algebraica para 
Wi+1- 

Podríamos usar el método de Newton о el método de secante para aproximar w;,1, pero 
esto complica considerablemente el procedimiento. En la práctica, los métodos implícitos 
multipasos no se utilizan de acuerdo con lo descrito antes. Más bien, se usan para mejorar 
las aproximaciones obtenidas con los métodos explícitos. La combinación de un método 
explícito para predecir y uno implícito para mejorar la predicción recibe el nombre de 
método indicador-corrector. 

Considere el siguiente método de cuarto orden para resolver un problema de valor ini- 
cial. El primer paso es calcular los valores iniciales wọ, w1, w2 y w3 para el método de cuatro 
pasos de Adams—Bashforth. Para hacerlo usamos el método de un paso de cuarto orden, el 
método Runge-Kutta de cuarto orden. Lo siguiente es calcular una aproximación уд, para 
y(t4) por medio del método explícito de Adams-Bashforth como indicador: 


h 
Wap = из + 2455 (5, w3) — 59 (0, w2) + 37 f (t1, w1) — 9 f (to, wo)]. 


Esta aproximación mejora al insertar wa, en el lado derecho del método implícito de tres 
pasos de Adams—Moulton y usar ese método como corrector. Esto nos da 


} 
w4 из + Ofa wap) + 19 F(t, w3) — 5 f (h, w2) + f (fi, w1)] 


La única evaluación de función nueva requerida en este procedimiento es f (t4, идр) en la 
ecuación de corrección; todos los demás valores de f se han calculado para aproximaciones 
previas. 
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A continuación se usa el valor и сото la aproximación para y(t4), у la técnica para 
utilizar el método Adams—Bashforth como indicador y el método Adams—Moulton como 
corrector se repite para encontrar ws, y ws, las aproximaciones inicial y final para y(t5). Este 
proceso continúa hasta que obtenemos una aproximación wy para y(ty) = у(р). 

Las aproximaciones mejoradas para y(t;+1) se pueden obtener al iterar la fórmula de 
Adams—Moulton, pero esto converge para la aproximación provista рог la fórmula implícita 
en lugar de la solución y(t;+1). Рог lo tanto, normalmente, es más eficiente usar una reduc- 
ción en el tamaño de paso si se necesita precisión mejorada. 

El algoritmo 5.4 está basado en el método Adams-Bashforth de cuarto orden como in- 
dicador y una iteración para el método Adams—-Moulton como corrector, con los valores 
iniciales obtenidos a partir del método Runge-Kutta de cuarto orden. 


Indicador-corrector de Adams de cuarto orden 


Para aproximar la solución del problema de valor inicial 


y =f(t,y) ast<b, у(а) =а, 
en(N + 1) números igualmente espaciados en el intervalo [a, b]: 
ENTRADA extremos а, b; entero N; condición inicial о. 
SALIDA aproximación w рага y en los valores (N + 1) de £. 


Paso 1 Determine h = (b — а)/ №; 
to = а; 
wo = Q; 
SALIDA (tọ, Wo). 
Paso 2 Para i = 1,2, 3, haga los pasos 3-5. 
(Calcule los valores iniciales con el método Runge-Kutta.) 


Paso 3 Determine Кү =hf(t;-1,w¡-1); 
Къ =hf(ti-1 +h/2,w¡-1 + K1/2); 
K3=hf(ti-1 + h/2, wi-1 + K2/2); 
K4 = hf (1 +h, и + K3). 

Paso 4 Determine w; = и; + (Kı +2K2 +2K3 + K4)/6; 
ti =a +ih. 

Paso 5 SALIDA (ti, wi). 

Paso 6 Para i = 4,... , N haga los pasos 7-10. 

Paso 7 Determine t =a + ih; 

w = w3 + [55 f (t3, w3) — 59 f (t2, w2) +37 f (ti, w1) 
= 9 f (to, wo) ]/24; (Prediga wi.) 


w = из + h[9 f(t, w) + 19 (13, из) — 5f (t, w2) 
+ f (ti, w1)]/24. (Corrija wi.) 


Paso 8 SALIDA (t,w). 
Paso 9 Paraj=0,1,2 


Determine /; = tj41; (Prepara la siguiente iteración.) 
р Мр. 
Paso 10 Determine їз = t; 
Уз = №. 


Paso 11 PARE. и 
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Ejemplo 5 Aplique el método indicador-corrector de cuarto orden de Adams con h = 0.2 y los valores 
iniciales del método de cuarto orden de Runge-Kutta para el problema de valor inicial 


y=y-P+1, 0<t<2, 30)=0.5. 


Solución Esta es una continuación y modificación del problema considerado en el ejemplo 1 
al inicio de la sección. En ese ejemplo, encontramos que las aproximaciones de inicio a partir 
de Runge-Kutta son 


y (0) = wo = 0.5, y (0.2) ~ и = 0.8292933, y(0.4) = w2 = 1.2140762, y 
y (0.6) = w3 = 1.6489220, 


y el método Adams-—Bashforth de cuarto orden nos da 
0.2 
y (0.8) Y w4p = из + E (55 f (0.6, из) — 59 f (0.4, w2) + 37 f (0.2, w1) — 9 f 0, wo)) 


0.2 
= 1.6489220 + эд 227006. 1.6489220) — 59 f (0.4, 1.2140762) 


+ 37 f (0.2, 0.8292933) — 9 f (0, 0.5)) 
= 1.6489220 + 0.0083333(55(2.2889220) — 59(2.0540762) 
+ 37(1.7892933) — 9(1.5)) 
= 2.1272892. 


Ahora utilizaremos wa, como indicador de la aproximación para у(0.8) у determinaremos el 
valor correcto wa, a partir del método implícito de Adams—Moulton. Esto nos da 


27 
y(0.8) ~ w4 = w3 + 2 (9700.8, wap) + 19 (0.6, w3) — 5 f (0.4, w2) + 700.2, w1)) 


0.2 
= 1.6489220 + 57 (9 f (0.8, 2.1272892) + 19 f (0.6, 1.6489220) 


— 5 f (0.4, 1.2140762) + f (0.2, 0.8292933)) 

= 1.6489220 + 0.0083333(9(2.4872892) + 19(2.2889220) — 5(2.0540762) 
+ (1.7892933)) 

= 2.1272056. 


Ahora utilizamos esta aproximación para determinar el indicador у, para у(1.0) сото 
0.2 
y (1.0) Y ws, = w4 + LOS w4) — 59 f (0.6, из) + 37 f (0.4, w2) — 9 f (0.2, w1)) 


0.2 
= 2.1272056 + эд 227 08. 2.1272056) — 59 f (0.6, 1.6489220) 


+ 37 f (0.4, 1.2140762) — 9 f (0.2, 0.8292933)) 
= 2.1272056 + 0.0083333(55(2.4872056) — 59(2.2889220) 
+ 37(2.0540762) — 9(1.7892933)) 
= 2.6409314 


Tabla 5.14 


Edward Arthur Milne (1896— 
1950) trabajó en investigación 
balística durante la Primera 
Guerra Mundial y, después, 
para Solar Physics Observatory, 
en Cambridge. En 1929, fue 
nombrado W. W. Rouse Ball 
Chair en el Wadham College en 
Oxford. 


El nombre de Simpson está 
asociado con esta técnica porque 
se basa en la regla para la 
integración de Simpson. 
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y corregimos esto con 


0.2 
y(LO) ~ ws = w4 + 57 (9 F1.0, wsp) + 19 f (0.8, wa) — 5 f (0.6, юз) + f (0.4, w2)) 


0.2 
= 2.1272056 + 7 (9 f (1.0, 2.6409314) + 19 f (0.8, 2.1272892) 


— 5f (0.6, 1.6489220) + f (0.4, 1.2140762)) 

= 2.1272056 + 0.0083333(9(2.6409314) + 19(2.4872056) — 5(2.2889220) 
+ (2.0540762)) 

= 2.6408286. 


En el ejemplo 1, encontramos que utilizar el método explícito de Adams—Bashforth sólo pro- 
dujo resultados que eran inferiores a los de Runge-Kutta. Sin embargo, estas aproximaciones 
para y(0.8) y y(1.0) son precisas, respectivamente, dentro de 


[2.1272295 — 2.1272056| = 2.39 x 107° y |2.6408286 — 2.6408591| = 3.05 х 107°, 
en comparación con las de Runge-Kutta, lo cual es preciso, respectivamente, dentro de 


[2.1272027 — 2.1272892| = 2.69 x 107° y |2.6408227 — 2.6408591| = 3.64 х 107. 


Las aproximaciones restantes del indicador-corrector se generaron mediante el algoritmo 5.4 


y se muestran en la tabla 5.14. ш 
Error 
ti и = y (ti) Wi ly; — wil 

0.0 0.5000000 0.5000000 0 

0.2 0.8292986 0.8292933 0.0000053 
0.4 1.2140877 1.2140762 0.0000114 
0.6 1.6489406 1.6489220 0.0000186 
0.8 2.1272295 2.1272056 0.0000239 
1.0 2.6408591 2.6408286 0.0000305 
12 3.1799415 3.1799026 0.0000389 
14 37324000 37323505 00000495 
1.6 4.2834838 4.2834208 0.0000630 
1.8 4.8151763 4.8150964 0.0000799 
20 5.3054720 5.3053707 0.0001013 


Otros métodos multipasos se pueden derivar por medio de integración de polinomios de 
interpolación sobre intervalos de la forma [ £;, t;+1], para j < i — 1, para obtener una apro- 
ximación рага y (t;+1). Cuando se integra un polinomio de interpolación sobre [£;_3, £;+1], el 
resultado es el método explícito de Milne: 


4h 
Wi+1 =Wj¡3 + 3 BA, wi) = /@—1, мр) + 2f (0-2, wj-2)l, 


que tiene un error de truncamiento local уб) (&;), para algunos &; € (t;_3, +1). 
El método de Milne se usa ocasionalmente como indicador para el método implícito 
de Simpson, 


h 
И ы = Wi-1 + zl isa Wi) + АД (ti, wi) + РО, w-0l, 


que tiene un error de truncamiento local — (hf /90)y® (&;), para algunos $; € (ti—1, ti+1), Y 
se obtiene al integrar un polinomio de interpolación sobre [t;i—1, ti+1]. 
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En general, el error de truncamiento local relacionado con el método indicador corrector 
del tipo Milne-Simpson es más pequeño que el del método Adams—Bashforth-Moulton. Pero 
la técnica tiene uso limitado debido a los problemas de error de redondeo, los cuales no se 
presentan con el procedimiento de Adams. Esta elaboración se estudia en la sección 5.10. 


La sección Conjunto de ejercicios 5.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 5.7 Método multipasos de tamaño de paso variable 


El método Runge-Kutta-Fehlberg se utiliza para el control de error porque en cada paso 
ofrece, con un costo adicional pequeño, dos aproximaciones que se pueden comparar y re- 
lacionar con el error de truncamiento local. Las técnicas de indicador-corrector generan dos 
aproximaciones en cada paso, por lo que son candidatos naturales para la adaptación de 
control de error. 

Para demostrar el procedimiento de control de error, construimos un método indicador- 
corrector de tamaño de paso variable mediante el método explícito Adams-Bashforth 
de cuatro pasos como indicador y el método implícito Adams-Moulton de tres pasos como 
corrector. 

El método de Adams-Bashforth de cuatro pasos proviene de la relación 


} 
уб) = y(t) + „51% Y) — 59 f (1, y(t;1)) 


251 Den 4р5 
+37 F (ti2, у@—2)) — 9 f (ti-3, y (ti—3))] + 720) (ADW, 


para algunos 2; € (ti—3, ti+1). La suposición de que las aproximaciones Wo, W1, ... , Wi son 
todas exactas, implica que el error de truncamiento local Adams-Bashforth es 
Y tig) = Ур: 251 


= yO (Aht. 
7 7007 (0) (5.40) 


Un análisis similar del método Adams-Moulton de tres pasos, que proviene de 
h 
уйы) = y (01) + 5д!?/ listo Y (413) + 19 F (85, y) — 5-1, у@—1)) 


19 
+ f (iz, y (t¡-2))1 — эр? (0, 


para algunos 2; € (ti—2, t;+1), conduce al error de truncamiento local 


Y(t) -Wi 19 


(5) у. ht 
Р 7207 (д;)һ. (5.41) 


Рага avanzar más, debemos suponer que para valores pequeños de Л, tenemos 


Sar 
у®(фы) y (й). 
La efectividad de la técnica de control de error depende directamente de esta suposición. 


Si restamos la ecuación (5.41) de la ecuación (5.40), tenemos 


4 
Wi+1 — Wp,i+1 h (5), 5 (5), 3 ALO) 7 
= 251 ¡+19 DIZ h Hi), 
р 70! у? (@) у? (Д)] 51 7 (ñi) 
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por lo que 


(5) тү д 8 
у? (ДШ) ps is = Wp,i+1). (5.42) 


El uso de este resultado para eliminar el término relacionado con yA (Dht a partir de la 
ecuación (5.41) provee la aproximación para el error de truncamiento local Adams-Moulton 


Y(t) = wiil 195% 8 йн к= 19] ы — 7р1 
h Ка 270h 


[ti A)| = 


Suponga que ahora reconsideramos (ecuación 5.41) con un nuevo tamaño de paso qh al 
generar aproximaciones nuevas Ŵ p ¡+1 Y Ŵi+1. El objetivo es seleccionar q de tal forma que 
el error de truncamiento local provisto en la ecuación (5.41) esté acotada por una tolerancia 
prescrita e. Si suponemos que el valor y® (y) en la ecuación (5.41) relacionado соп qh tam- 
bién se aproxima mediante la ecuación (5.42), entonces 


199*n* [ 8 


ly +qh) —Wisil _ 194% 
220 (ap YH T Weil 


— 6) А 
ah 720 ly (ш) 


194 [иы = жр 
270 h , 


y necesitamos seleccionar q de tal forma que 


ly +qh) — Wisil 199* [иы = жр 
qh 270 h 


Es decir, seleccione q de tal forma que 


(E he у ( he y 
q< rl — E 
19 [и ы = р |wi+1 = рі 


En este desarrollo se ha realizado una serie de suposiciones de aproximación, por Іо que 
en la práctica q se selecciona de manera conservadora, a menudo como 


e ( he E 
= |wi+1 — Wp,i+1l ` 


Un cambio еп el tamaño de paso para un método multipasos es más costoso en términos 
de evaluaciones de función que para un método de un paso porque se deben calcular valores 
iniciales igualmente espaciados. En consecuencia, es una práctica común ignorar el cambio de 
tamaño de paso siempre que el error de truncamiento local esté entre e/10 y e, es decir, cuando 


ly ig) — wiil 19 lWi41 р, 
h 270h 


E 
10 < |ti (A)| = 


Además, a q suele asignársele una cota superior para garantizar que una aproximación pre- 
cisa única poco común no resulte en un tamaño de paso demasiado grande. El algoritmo 5.5 
incluye esta protección con una cota superior de 4. 

Recuerde que los métodos multipasos requieren tamaños de paso iguales para los valo- 
res iniciales. Por lo que cualquier cambio en el tamaño de paso necesita recalcular de nuevo 
los valores iniciales en ese punto. En los pasos 3, 16 y 19 del algoritmo 5.5, esto se hace 
llamando un subalgoritmo Runge-Kutta (algoritmo 5.2), configurado en el paso 1. 
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Indicador-corrector de tamaño de paso variable Adams 


Para aproximar la solución del problema de valor inicial 


y =f(t,y) ast<b, уа) =а 
con error de truncamiento local dentro de una tolerancia determinada: 


ENTRADA extremos а, b; condición inicial о; tolerancia TOL; tamaño máximo de 
paso hmáx; tamaño mínimo de paso hmín. 


SALIDA {, 5, wi, л, donde en el ¡-ésimo paso w; se aproxima a y(1;) y se utiliza el 
tamaño de paso h, o un mensaje de que se excedió el tamaño mínimo de paso. 


Paso 1 Configurar un subalgoritmo para el método Runge-Kutta de cuarto orden llamado a 
RKA4(h, Vo, хо, UL, X1, V2, X2, 03, Хз) que acepta como entrada un tamaño de paso Л 
y valores iniciales vo Y у(хо) y regresa[(x;, vj) | j = 1,2, 3) definidos mediante 
lo siguiente: 
рага j = 1,2,3 
determine Kı = hf (xj-1, Uj-1); 
Kı = hf (xj +h/2, vait K1/2) 
Кз = hf (xj +h/2, 031+ К/2) 
Ka = hf (xj +h, Vj—1 + K3) 
vj = 031 + (Kı + 2K2 + 2K; + K4)/6; 


Xj = Хо + jh. 
Paso 2 Determine tọ = a; 
wo = 0; 
А = тах; 


FLAG = 1; (FLAG se usará рага salir del ciclo en el paso 4.) 
LAST =0; (LAST indicará cuando se calcula la última variable.) 
SALIDA (tọ, wo). 


Paso З Llame RK4(h, wo, to, W1,f1, W2, Їз, W3, 13); 
Determine NFLAG = 1; (Indique el cálculo de RK 4.) 
ї=4; 
1= в +h. 


Paso 4 Mientras (FLAG = 1) haga los pasos 5-20. 
Paso 5 Determine W P = м; + 55 w¡-1) — 59 (1:2, Wi—2) 
+37 f (ti-3, Wi-3) — 9 f (ti—4, Wi—-4)]; (Prediga w;.) 
WC = wii 9/0 WP) +19f0 wi) 


— 5 (1-2, Wi—2) + f (ti-3, wi-3)]; (Corrija wi.) 
o =19/WC — W P|/ (2170h). 


Paso 6 Siø < TOL entonces haga los pasos 7-16 (Resultado aceptado.) 
también haga los pasos 17-19. (Resultado rechazado.) 


Paso 7 Determine w; = WC; (Resultado aceptado.) 
f= t 


Paso 8 Si NFLAG = 1 entonces para j = i — 3,i — 2,i — 1,i 
SALIDA (j, tj, Wj, h); 
(Resultados previos también aceptados .) 
también SALIDA (i, t;, w;, h). 
(Resultados previos ya aceptados .) 
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Paso 9 Si LAST = 1 entonces determine FLAG = О (El siguiente paso es 20.) 
también haga los pasos 10-16. 


Paso 10 Determine i = i + 1; 
NFLAG = 0. 


Paso 11 Siø < 0.1 TOLo t;¡-1 +h > b entonces haga los pasos 12-16. 
(Incrementa h si es más preciso que lo requerido o disminuye 
h para incluir b como punto de malla.) 


Paso 12 Determine q = (ТО (20))!/*. 


Paso 13 Si q > 4 entonces determine Л = 4h 
también determine Л = qh. 


Paso 14 Si h > hmáx entonces determine h = hmáx. 


Paso 15 Sit;—ı +4h > b entonces 
determine Л = (b — t;_1)/4; 
LAST=1. 


Paso 16 Llame RK4(h,w;_1, П—1, Wi, Li, Wi+1, ра, Wi42> іцо); 
Determine NFLAG = 1; 
і = і +3. (Rama verdadera completada. Termina paso 6 .) 
Próximo paso 20 


Paso 17 Determine q = (TOL/(20))!/*. (Rama falsa a partir del paso 6: 
Resultado rechazado.) 


Paso 18 Si q < 0.1 entonces determine Л = 0.14 
también determine h = qh. 


Paso 19 Si h < hmín entonces determine FLAG = 0; 
SALIDA (‘mínima excedida’) 
también 
si NFLAG = 1 entonces determine i = i — 3; 
(Resultados previos también rechazados.) 
Llame RK4(h, wi—1, ti—1, Wi, ti, Wi+1> 
їі, о, о); 
determine i = i + 3; 
NFLAG = 1. (Fin del paso 6.) 


Paso 20 Determine t = t;_¡ + h. (Fin del paso 4.) 
Paso 21 PARE. ш 


Ejemplo 1 Utilice el método indicador-corrector de tamaño de paso variable de Adams con tamaño 
máximo de paso hmáx = 0.2, tamaño mínimo de paso hmín = 0.01, y tolerancia TOL = 1075 
para aproximar la solución del problema de valor inicial 


y=y-P+1, 0<t<2, у(0) = 0.5. 


Solución Comenzamos con h = hmáx = 0.2 y obtenemos wo, w1, w2, у w3 mediante Runge- 
Kutta, a continuación encontramos урд у wca al aplicar el método indicador-corrector. Estos 
cálculos se realizaron en el ejemplo 5 de la sección 5.6, donde se determinó que las aproxi- 
maciones Runge-Kutta con 


y(0) = wo =0.5, y(0.2) ~ w; =0.8292933, y(0.4) = w2 = 1.2140762, y 
y (0.6) = w3 = 1.6489220. 
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Tabla 5.15 
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El indicador y corrector dan 
y (0) = wo = 0.5, y (0.2) ~ и = 0.8292933, y(0.4) = w2 = 1.2140762, y 
y (0.6) = из = 1.6489220 
y 


0.2 
y(0.8) E Wap = w3 + 7 (55 700.6, юз) — 59 f (0.4, w2) + 37 f (0.2, w1) — 970, wo)) 


= 2.1272892 
y 


0.2 
y(0.8) X wae = w3 + 7 (9 F (0.8, wap) + 19 F (0.6, из) — 5 f (0.42, w2) + f (0.2, w1)) 
= 2.1272056. 


Ahora necesitamos determinar si las aproximaciones son suficientemente precisas о si se 
necesita cambiar el tamaño de paso. Primero, encontramos 


19 


o=- |2.1272056 — 2.1272892| = 2.941 х 107°. 
270h 


[чс — wal = 700.2) 


Puesto que esto excede la tolerancia de 1075, se necesita un tamaño de paso nuevo y éste es 


10—5 ү!/* 1075 = 
h= = 0.2) = 0.642(0.2) ~ 0.128. 
1" ( 28 ) (as x 05) 0.3) 82 


Como consecuencia, necesitamos comenzar de nuevo con el procedimiento, al calcular los 
valores de Runge-Kutta con este tamaño de paso y, a continuación, utilizamos el método 
indicador-corrector con este tamaño de paso para calcular los valores nuevos de уд, Y W4c- 
Después, necesitamos ejecutar una verificación de precisión en estas aproximaciones para 
ver si tuvimos éxito. La tabla 5.15 muestra si esta segunda ejecución es exitosa y enumera 


todos los resultados obtenidos en el algoritmo 5.5. ш 
ti уб) Wi hi 01 |у@) — wil 
0 0.5 0.5 
0.12841297 070480460 070480402 0.12841297 4.431680 x 1056 0.0000005788 
0.25682594 093320140 0.93320019 0.12841297 4.431680 x 1076 00000012158 
0.38523891 1.18390410 1.18390218 0.12841297 4.431680 x 1058 0.0000019190 
0.51365188 145545014 1.45544767 0.12841297 4.431680 х 1058 00000024670 
0.64206485 1.74617653 1.74617341 0.12841297 5.057497 х 1056 0.0000031210 
0.77047782 2.05419248 2.05418856 0.12841297 5.730989 х 1056 00000039170 
0.89889079 2.37734803 2.37734317 0.12841297 6.522850 х 1056 00000048660 
1.02730376 2.71319871 2.71319271 0.12841297 7.416639 х 1056 0.0000060010 
1.15571673 3.05896505 3.05895769 0.12841297 8.433180 х 1056 00000073570 
1.28412970 341148675 3.41147778 0.12841297 9.588365 х 1056 00000089720 
1.38980552 3.70413577 3.70412572 0.10567582 7.085927 х 10568 00000100440 
1.49548134 3.99668536 3.99667414 0.10567582 7.085927 х 1076 00000112120 
1.60115716 4.28663498 4.28662249 010567582 7.085927 х 1076 00000124870 
1.70683298 4.57120536 4.57119105 0.10567582 7.085927 х 1056 00000143120 
1.81250880 4.84730747 4.84729107 0.10567582 7.844396 х 1076 00000163960 
1.91818462 5.11150794 5.11148918 0.10567582 8.747367 х 1076 00000187650 
1.93863847 5.16095461 5.16093546 0.02045384 1.376200 х 1078 00000191530 
1.95909231 5.20978430 5.20976475 0.02045384 1.376200 х 1075 0.0000195490 
1.97954616 5.25796697 5.25794701 0.02045384 1.376200 х 10-8 0.0000199540 
200000000 5.30547195 5.30545159 0.02045384 1.376200 х 1078 00000203670 


f 


5.8 Métodos de extrapolación 241 


La sección Conjunto de ejercicios 5.7 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


5.8 Métodos de extrapolación 


La extrapolación se usó en la sección 4.5 para aproximar integrales definidas, en donde 
encontramos que al promediar de manera correcta las aproximaciones trapezoidales, relati- 
vamente imprecisas, se producían otras nuevas en extremo precisas. En esta sección aplica- 
remos la extrapolación para incrementar la precisión de las aproximaciones para la solución 
de problemas de valor inicial. Como observamos antes, las aproximaciones originales deben 
tener una expansión de error de una forma específica para que el procedimiento sea exitoso. 

Para aplicar la extrapolación en la resolución de problemas de valor inicial usamos la 
técnica con base en el método de punto medio: 


Wi+1 = №] +2Af Cti, wi), para i > 1. (5.43) 


Esta técnica requiere dos valores iniciales wọ y w; que se necesitan antes de que se pueda de- 
terminar la primera aproximación del punto medio у». Un valor inicial es la condición inicial 
рага wo = y(a) = о. Para determinar el segundo valor inicial, w,, aplicamos el método de 
Euler. Las aproximaciones subsiguientes se obtienen a partir de la ecuación (5.43). Después 
de generar una serie de aproximaciones de este tipo que terminan en un valor £, se realiza una 
corrección del extremo relacionada con las dos aproximaciones finales de punto medio. Esto 
produce una aproximación w(t, h) para y(t) que tiene la forma 


y (0) =w, л) + У 8л, (5.44) 
k=1 


donde 8; son constantes relacionadas con las derivadas de la solución y(t). El punto im- 
portante es que 5; no depende del tamaño de paso Л. Los detalles de este procedimiento se 
pueden encontrar en el artículo de Gragg [Gr]. 

Para ilustrar la técnica de extrapolación para resolver 


у'@)= ft,y) a<t<b, у(ау=о, 


suponga que tenemos un tamaño de punto fijo h. Nos gustaría aproximar y(t,) = y(a + h). 
Para el primer paso de extrapolación, dejamos que ho = h/2 y usamos el método de 
Euler con wọ = о para aproximar y (a + ho) = у(а + h/2) como 


w1 = Wo + ho f (a, wo). 


Aplicamos entonces el método de punto medio con f;_; =a y ti = a + ho = a + h/2 para 
producir una primera aproximación y(a + h) = y(a + 2họ), 


W2 = Wọ + 2hp f(a + ho, №1). 
Se aplica la corrección del extremo para obtener la aproximación final рага у(а + л) para el 


tamaño de paso họ. Esto resulta en la aproximación O (^5) para y(t1). 


1 
у= 5172 + w1 + ho f (a + 2hp, w2)]. 


Guardamos la aproximación у у y descartamos los resultados intermedios w; y w2. 

Para obtener la aproximación y, 1, para y(t¡), hacemos hı = Л/4 y usamos el método 
de Euler con wọ = о para obtener una aproximación para y(a + hı) = y(a + h/4), que 
llamaremos w;: 


wı = wo + hı f (a, wo). 
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A continuación aproximamos у(а +2h,) = у(а + h/2) con w2, y(a +3h1) = y(a + 
ЗА /4) соп из, y w4 para y(a + 4h1) = y(t,) con el método de punto medio: 


wz = Wo +2h, f (a + hi, w1); 
мз = wı + 2h: f (a + 2h1, w2), 


w4 = w2 + 2h, f (a + З, ууз). 


Ahora, se aplica la corrección del extremo para w3 y w4 para producir la aproximación me- 
jorada O(h?) para y(t1), 


1 
Ya, = z4 + w3 + hı f(a + 4h, w4)]. 


Debido a la forma el error provisto en la ecuación (5.44), las dos aproximaciones para 
y(a+h) tienen la propiedad de que 


(a+ h) = +ô ш #7 2 и? = И 
уа тп) = у 1 2 2 2 = Ул 11 276 
y 
(a+h) +ô i ge h yA sa + 
a 1) = — — ... = TEE 
y Yz 1 4 2 4 Y2,1 136 2256 


Podemos eliminar la parte O(h°) de este error de truncamiento al promediar las dos fórmulas 
de manera adecuada. Especialmente, si restamos la primera fórmula a cuatro veces la segunda 
y dividimos el resultado entre tres, obtenemos 


ht 


1 
yla +h) = y1 + 3021 Уц) 264 + 


Por lo que la aproximación рага y(t¡) dada por 


1 
y2,2 = y21 + 3021 = уз) 


tiene un error de orden om. 

A continuación hacemos h) = h/6 y aplicamos el método de Euler una vez, seguido del 
método de punto medio cinco veces. А continuación, utilizamos la corrección del extremo 
para determinar la aproximación h°, уз ¡, para у(а + h) = y(t1). Esta aproximación se pue- 
de promediar con y, para producir una segunda aproximación O(h*) que designamos уз 2. 
A continuación, se promedia y3,2 y y2,2 para eliminar los términos de error O(h*) y produci- 
mos una aproximación con error de orden O(h%). Se generan fórmulas de orden superior al 
continuar con el proceso. 

La única diferencia significativa entre la extrapolación realizada aquí y la que utiliza in- 
tegración de Romberg en la sección 4.5 resulta de la forma de seleccionar las subdivisiones. 
En la integración de Romberg, existe una fórmula conveniente para representar las aproxi- 
maciones de la regla trapezoidal compuesta que usa divisiones consecutivas del tamaño de 
paso mediante los enteros 1, 2, 4, 8, 16, 32, 64, . . . . Este procedimiento permite el proceso 
de promediado para continuar de una manera que se puede seguir fácilmente. 

No tenemos los medios para producir fácilmente aproximaciones refinadas para proble- 
mas de valor inicial, por lo que se seleccionan las divisiones para la técnica de extrapola- 
ción para minimizar el número de evaluaciones de función requerido. El procedimiento de 


Tabla 5.16 


El algoritmo 5.6 utiliza nodos de 
la forma 2" y 2" · 3. Es posible 
usar otras opciones. 
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promediado que surge de esta selección de la subdivisión, mostrado en la tabla 5.16, no es 
básico, pero, aparte de eso, el proceso es igual al que se usa para la integración de Romberg. 


ул = wW(t, ho) 
hî 
Ул = w(t, hi) у2 = Ya + 553021 ул) 
по = hi 
h3 № 
Уз = w(t, h2) узо = уз + 270517 у») узз = узо + 7705127 У) 
hi — 5 ho — №5 


El algoritmo 5.6 utiliza la técnica de extrapolación con la secuencia de enteros 


qo =2, qı =4, Ф = 6, аз = 8, q4 = 12, 45 = 16, q=24 у дф = 32. 


Se selecciona un tamaño de paso básico h, y el método progresa mediante h; = h/q;, para 
cada і = 0,... ,7, para aproximar y(t + Л). El error se controla al requerir que se calculen 
las aproximaciones y1 1, у2,2, ... hasta] y; ¡ — y;-1,;-1| sea menor a la tolerancia provista. Si 
la tolerancia no se alcanza mediante і = 8, entonces se disminuye h y el proceso se vuelve 
a aplicar. 

Se especifican los valores máximo y mínimo de h, hmín, y hmáx, respectivamente, 
para garantizar el control del método. Si se encuentra que y;; es aceptable, entonces w; se 
configura en у;; у los cálculos comienzan de nuevo para determinar у», que aproximará 
y(t,) = y(a +2h). El proceso se repite hasta que se determina la aproximación wy para y(b). 


Extrapolación 
Para aproximar la solución del problema de valor inicial 


у'=/@,у)) a<t<b, у(а) =xw, 
con error de truncamiento local dentro de una tolerancia determinada: 


ENTRADA extremos a, b; condición inicial œ; tolerancia TOL; tamaño máximo de 
paso hmáx; tamaño mínimo de paso hmín. 


SALIDA Т7, W, л, йопае W aproxima y(t) y se usa el tamaño de paso h o 
un mensaje de que se excedió el tamaño mínimo de paso. 


Paso 1 TInicialice el arreglo NK = (2,4, 6, 8, 12, 16, 24, 32). 
Paso 2 Determine TO = a; 

МО = о; 

h = тах; 

FLAG = 1. (Se usa FLAG para salir del ciclo en el paso 4.) 
Paso З Parai = 1, 2,...,7 

рага j = 1,...,і 
determine Qij = (МК, МК). (Vota: Qij = Н, 

Paso 4 Mientras (FLAG = 1) haga los pasos 5-20. 


Paso 5 Determine k = 1; 
NFLAG=0. (Cuando se alcanza la precisión deseada, 
NFLAG se configura еп1.) 
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Paso 6 Mientras (k < 8 y NFLAG = 0) haga los pasos 7-14. 


Paso 7 Determine HK = А/ МК; 
T=TO, 
W2 = №0; 
W3 = W2 + НК. (Т, №2); (Primer paso de Euler.) 
Т= То + НК. 


Paso 8 Paraj = 1,..., МК, – 1 
determine W1 = №2; 
W2 = W3; 
W3=W1+2HK - F(T, W2); (Método de punto medio.) 
T=TO+(¡+1)-HK. 


Paso 9 Determine у, = [W3 + W2 + HK . f(T, W3)]/2. 
(Corrección de extremo para calcular укл.) 


Paso 10 Si k > 2 haga los pasos 11-13. 


(Nota: ур 1 = Yk-1,1, Yk-2 = Yk-2,2) »»»» Y1 = Yk—1,k—1 уа que sólo 
se guarda la fila previa de la tabla.) 


Paso 11 Determine j = k; 
v = yı. (Guarda y k-1.-1-) 


Paso 12 Mientras (j > 2) haga 
Y] у]—1 
+ =———— 5 
Ору = 1 
(Extrapolación para calcular уу—\ = Yk,k-¡+2-) 


ayi hY ja ) 
lei = 


determine y;-1 = yj 


(Nora: Yi = 


j=j-1. 
Paso 13 Sily, — v| < TOL entonces haga NFLAG = 1. 
(yı aceptado como w nueva.) 
Paso 14 Determine К = К + 1. (Termina paso б) 
Paso 15 Determine k =k — 1. (Parte del paso 4) 


Paso 16 Si NFLAG =0 haga los pasos 17 y 18 (Resultado rechazado.) 
también haga los pasos 19 y 20. (Resultado aceptado.) 


Paso 17 Determine h = h/2. (Valor nuevo para w rechazado, h disminuye .) 


Paso 18 Si h < hmín entonces 
SALIDA (hmín excedida” y; 
Determine FLAG = 0. (Termina paso 16) 
(Rama verdadera completada, el siguiente paso 
regresa al paso 4.) 


Paso 19 Determine WO = уу; (Valor de w nuevo aceptado .) 
TO = ТО +h, 
SALIDA (ТО, МО, А). 


Ejemplo 1 
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Paso 20 SiTO > b entonces determine FLAG = 0 
(Procedimiento completado con éxito.) 
también si TO + h > b entonces determine Л = b — ТО 
(Termina en t =b.) 
también si (k < Зул < 0.5S(hmáx) entonces determine Л = 2h. 
(Incrementa tamaño de paso, de ser posible) 
(Fin del paso 4 y 16) 


Paso 21 PARE. ш 


Use el método de extrapolación con el tamaño de paso máximo hmáx = 0.2, tamaño de paso 
mínimo hmín = 0.01 y tolerancia TOL = 107° para aproximar la solución del problema de 
valor inicial 


y=y-P*+1, 0<t<2, у(0) = 0.5. 


Solución Рага el primer paso del método de extrapolación, hacemos wọ = 0.5, to = 0, y 
h = 0.2. A continuación, calculamos 


ho = h/2 =0.1, 
wi = wo + ho f (to, wo) = 0.5 +0.1(1.5) = 0.65, 


w2 = Wo + 2ho f (to + ho, w1) = 0.5 + 0.2(1.64) = 0.828, 


y la primera aproximación para y(0.2) es 


Уп = Lo + w1 + ho f (to + 2ho, w2)) = 1 0.828 + 0.65 + 0.1 f (0.2, 0.828)) 
= 0.8284. 
Para la segunda aproximación para y(0.2), calculamos 
һу = h/4 = 0.05, 
э = wo + hı f (to, wo) = 0.5 + 0.05(1.5) = 0.575, 
w2 = Wo + 2h; f (to + һу, w1) = 0.5 + 0.1 (1.5725) = 0.65725, 
w3 = w1 + 2h; f (to + 2h1, w2) = 0.575 + 0.1 (1.64725) = 0.739725, 


wa = w2 + 2h; f (to + 3h1, из) = 0.65725 + 0.1 (1.717225) = 0.8289725. 


Entonces, la aproximación de la corrección del extremo es 
1 
Ya = 5 (W4 + w3 + hi f (o +4hi, w4)) 


1 
= z 0-8283725 + 0.739725 + 0.05 f (0.2, 0.8289725)) = 0.8290730625. 


Esto nos da la primera aproximación de extrapolación 


(1/4? 


aa) (узр = уп) = 0.8292974167. 


Ya = Ya + ( 
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La tercera aproximación se encuentra al calcular 

haz = h/6 = 0.03, 
wo + h2 f (to, wo) = 0.55, 
w2 = Wo + 2h, f (to + h2, w1) = 0.6032592593, 
w3 = w; + 2h, f (to + 2h2, w2) = 0.6565876543, 
wa = w2 + 2h, f (to + 3h2, w3) = 0.7130317696, 
ws = w3 + 2h) f (to + 4h2, w4) = 0.7696045871, 
Wo = w4 + 2h2 f (to + 5h2, w5) = 0.8291535569, 


wi 


y entonces la aproximación de corrección del extremo 
1 
Ya = 5 (06 + ws + hf (to + блә, w6) = 0.8291982979. 


Ahora podemos encontrar dos aproximaciones extrapoladas 


(1/6)? 
Уз2 = уз + (+ — тет) (узі = y21) = 0.8292984862 
y 
= пу = 0.8292986199 
узз = узр + (> — Tar) Q32 — y2) = 0. | 
Puesto que 


|узз — yzl = 1.2 x 107% 


no satisface la tolerancia, necesitamos calcular por lo menos una fila de la tabla de extra- 
polación. Usamos лз = h/8 = 0.025 y calculamos w; con el método de Euler w»,--- , wg, 
a través del método de punto medio y aplicamos la corrección del extremo. Esto nos propor- 
cionará la aproximación nueva уд, que nos permite calcular la nueva fila de extrapolación 


Ул = 0.8292421745 ур = 0.8292985873 улз = 0.8292986210 уд = 0.8292986211. 


Al comparar |y44 — узз| = 1.2 х 107°, encontramos que la tolerancia de precisión no se 
ha alcanzado. Para obtener las entradas en la siguiente fila, usamos h4 = h/12 = 0.06. 
Primero, calcule w, con el método de Euler, a continuación у» a través de w12 con el método 
de punto medio. Finalmente, utilice la corrección del extremo para obtener уз. Las entradas 
restantes en la quinta columna se obtienen por medio de extrapolación y se muestran en la 
tabla 5.17. Puesto que yss — 0.8292986213 está dentro de 107° de Уда, Se acepta como 
la extrapolación para y(0.2). El procedimiento provee una nueva aproximación y(0.4). El 
conjunto completo de aproximaciones precisas para los lugares listados se proporciona en 
la tabla 5.18. п 


ул = 0.8284000000 
уз. = 0.8290730625 
уз = 0.8291982979 
улл = 0.8292421745 
ys.1 = 0.8292735291 


уз. = 0.8292974167 
узо = 0.8292984862 
удо = 0.8292985873 
уѕ2 = 0.8292986128 


узз = 0.8292986199 
уаз = 0.8292986210 уда = 0.8292986211 
ys 3 = 0.8292986213 уз.а = 0.8292986213 ys.5 = 0.8292986213 


Tabla 5.18 


5.9 Ecuaciones de orden superior y sistemas de ecuaciones diferenciales 247 


ti Yi = у(й) Wi hi k 
0.200 0.8292986210 0.8292986213 0.200 5 
0.400 1.2140876512 1.2140876510 0.200 4 
0.600 1.6489405998 1.6489406000 0.200 4 
0.700 1.8831236462 1.8831236460 0.100 5 
0.800 2.1272295358 2.1272295360 0.100 4 
0.900 2.3801984444 2.3801984450 0.100 7 
0.925 2.4446908698 2.4446908710 0.025 8 
0.950 2.5096451704 2.5096451700 0.025 3 
1.000 2.6408590858 2.6408590860 0.050 3 
1.100 2.9079169880 2.9079169880 0.100 7 
1.200 3.1799415386 3.1799415380 0.100 6 
1.300 3.4553516662 3.4553516610 0.100 8 
1.400 3.7324000166 3.7324000100 0.100 5 
1.450 3.8709427424 3.8709427340 0.050 7 
1.475 3.9401071136 3.9401071050 0.025 3 
1.525 4.0780532154 4.0780532060 0.050 4 
1.575 4.2152541820 4.2152541820 0.050 3 
1.675 4.4862274254 4.4862274160 0.100 4 
1.775 4.7504844318 4.7504844210 0.100 4 
1.825 4.8792274904 4.8792274790 0.050 3 
1.875 5.0052154398 5.0052154290 0.050 3 
1.925 5.1280506670 5.1280506570 0.050 4 
1.975 5.2473151731 5.2473151660 0.050 8 
2.000 5.3054719506 5.3054719440 0.025 3 


La prueba de que el método presentado en el algoritmo 5.6 converge implica resultados 


a partir de la teoría de capacidad de suma; se puede encontrar en el artículo original de Gragg 
[Gr]. Existen otros procedimientos de extrapolación, algunos de los cuales utilizan técnicas 
de tamaño de paso variable. Para los procedimientos adicionales con base en los procesos de 
extrapolación, consulte los artículos de Bulirsch y Stoer [BS1], [BS2] y [BS3] o el texto de 
Stetter [Stet]. Los métodos usados por Bulirsch y Stoer implican interpolación con funciones 
racionales en lugar de la interpolación polinomial utilizada en el procedimiento de Gragg. 


La sección Conjunto de ejercicios 5.8 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Ecuaciones de orden superior y sistemas de ecuaciones 
diferenciales 


Esta sección contiene una introducción a la solución numérica de problemas de valor inicial 
de orden superior. Las técnicas analizadas están limitadas a aquellas que transforman una 
ecuación de orden superior en un sistema de ecuaciones diferenciales de primer orden. Antes 
de analizar el procedimiento de transformación, se necesitan algunas observaciones respecto 
a los sistemas que implican ecuaciones diferenciales de primer orden. 

Un sistema de m-ésimo orden de problemas de valor inicial de primer orden tiene la 
forma 


== al ) 
—— = ,U],4U2,..., Um), 
dt 1 1 2 
duz 
> hit, U],U2,..., Um), (5.45) 
dt 
düm 
= Jal, ui, йо, --., Um), 


dt 
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Teorema 5.17 
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para a < t < b, con condiciones iniciales 


и1\(а) = о, и(а) = оо, ..., Unla) = Ap. (5.46) 


El objetivo es encontrar m funciones и1(ї), u2(t), ..., Um(£) que satisfacen cada una de las 
ecuaciones diferenciales junto con todas las condiciones iniciales. 

Para analizar la existencia y unicidad de las soluciones para los sistemas de ecuaciones, 
necesitamos ampliar la definición de la condición de Lipschitz para las funciones de distintas 
variables. 


Se dice que la función f (t, y1,... , Ym), definida en el conjunto 


D=((t,41,... Um)la <t<by — оо <и; < оо, para cada i =1,2,...,m), 


satisface la condición de Lipschitz en D en las variables и, из, ... , Um si existe una cons- 


tante L > 0 con 


m 


|f(t,U1,... Ин) = f OZ , Zm)| < 1 Уи; 21, 
j=1 (5.47) 


‚ ©т) еп D. п 


para todas las (1,41, ... ,Um) y (t, 21,... 


Al usar el teorema de valor medio se puede mostrar que si f y sus primeras derivadas 
parciales son continuas en D y si 


of (t, ир, ЕК 
ди; 


, Ит) 


EL, 


para cada = 1,2,... ,m y todas las (t, 4], ... , Um) en D, entonces f satisface la condición 
de Lipschitz en D con constante de Lipschitz L (consulte [BiR], p. 141). A continuación se 
muestra un teorema de existencia y unicidad básico, su demostración se puede encontrar en 
[BiR], p. 152-154. 


Suponga que 
D=([(t,4,,42,... ,Um)|a <t<by — оо < ui < оо, paracadai=1,2,...,m), 
y fi(t,U41],... , Um), para cada į = 1, 2,..., ту que es continua y satisface la condición 


de Lipschitz en D. El sistema de ecuaciones diferenciales de primer orden (5.45), sujeto a 
las condiciones iniciales (5.46), tiene una única solución и (t), ... ,Um(t), paraa < t <b. 
ш 


Los métodos para resolver sistemas de ecuaciones diferenciales de primer orden son ge- 
neralizaciones de los métodos de ecuaciones de primer orden simples que se han presentado 
antes en este capítulo. Por ejemplo, el método clásico de Runge-Kutta de orden 4 dado por 


Wo = Q, 


kı = hf (ti, wi), 


k ileg” tig 
= п і Wi ке > 
2 2 z“ 


Bemet жй 
== hf 1 z Wi 2 2 |> 
k4 = hf (ti41, wi + Кз), 


1 
Wip = Wi + ze + 2k + 2k3 + k4), para cada i = 0, 1,... 


Figura 5.6 
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utilizado para resolver el problema de valor inicial de primer orden 


у= (у), ast<b, y(a)=0, 


se generaliza de acuerdo con lo siguiente. 
Si se selecciona un entero N > 0 y se establece Л = (b — a)/N. La partición del inter- 
valo [a, b] en N subintervalos con los puntos de malla 


t¡=a+jh, paracadaj=0,1,..., №. 
Use la notación у; , para cada j =0,1,...,Nyi=1,2,...,m, para denotar una apro- 


ximación и; (tj). Es decir, у; aproxima Іа ¡-ésima solución u;(t) de (5.45) en el j-ésimo punto 
de malla ;;. Para las condiciones iniciales, establezca (consulte la figura 5.6) 


Wo = 01, W2,0 = Q2, . . ., Wm,0 = Om. (5.48) 


\ 
ula) = о 


a=b t 


Suponga que los valores w1,j, W2,j,..- , Wm,¡ Se han calculado. Nosotros obtenemos 
WI ¡+1> W2, ¡41 + => » Wm, ¡+1 al calcular primero 
Кы = Af, Wij Wij «> Wm,j), para cada i =1,2,...,m, (5.49) 


h 1 1 1 
kzi = hfi ( F 2? Wij F ¿A W2,j F 342 +, Мт, ј | з) > (5.50) 


рага cada i = 1,2,... , m; 


h 1 1 1 
kzi =), (a + Б, + 5k21, W2, ¡+ Б, ---;Wm, j + zem) ; (5.51) 


2 2 2 
para cada i = 1,2,... , m; 
Кы = РАО +h, w1,j + Кз, м2, + Кзо,..., Wm, j +K3,m), (5.52) 
рага cada і = 1, 2,... ‚т; y entonces 
1 
Wi j+ = Wijt gén + 20; + 2k3,i + Ка), (5.53) 
para cada і = 1,2, ... ‚т. Observe que todos los valores k; 1,k1>2,..., к.т deben calcu- 
larse antes de que cualquiera de los términos de la forma k2; se pueda determinar. En 
general, cada Ку 1, 2, ..., Кт, se debe calcular antes que cualquiera de las expresiones kz+1,i. 


El algoritmo 5.7 implementa el método Runge-Kutta de cuarto orden para sistemas de pro- 
blemas de valor inicial. 
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Ilustración 


Método Runge-Kutta para sistemas de ecuaciones diferenciales 


Para aproximar la solución del sistema de m-ésimo orden de problemas de valor inicial de 
primer orden 


ni 
uj; = fi(t, u1, U2,..., Um), a<t<b, con uj¡(a)=0;, 
para j = 1,2,... ,m en (N + 1) números igualmente espaciados en el intervalo [a, b]: 
ENTRADA extremos a, b; número de ecuaciones m; entero №; condiciones iniciales œ1,... , 0. 


SALIDA aproximaciones w ; para u ;(t) en (N + 1) valores Чет. 


Paso 1 Determine h = (b — a)/N; 
1 = а. 


Paso 2 Рага] = 1, 2,..., т determine wj = &j. 
Paso З SALIDA (7, и, уә, ..., Wm). 
Paso 4 Рага і = 1, 2,..., N haga los pasos 5-11. 


Paso 5 Рага j = 1, 2,..., т determine 
Ку = hfj(t, w1, w2, > Мт). 
Paso 6 Para j = 1, 2,..., т determine 


kaj = hf; (t + 5, w1 + fki, w2 + $ki2,..., Wm + 31m). 
Paso 7 Paraj = 1, 2,..., т determine 
ks; = АР ( + 5, и + 3k2.1,W2 + 502,0... Wm + 10). 


Paso 8 Paraj = 1, 2,..., т determine 
kaj = АР АР, му + Кз, ио + А2, ..., Wm + Ёз). 


Paso 9 Paraj = 1, 2,..., т determine 
w; =w; + (у +2k2 + 23; + Ка, ¡)/6. 


Paso 10 Determine t = а +іһ. 
Paso 11 SALIDA (t,w1,W2,..., Wm). 
Paso 12 PARE. п 


La ley de Kirchhoff establece que la suma de todos los cambios de voltaje alrededor de un 
circuito cerrado es cero. Esta ley implica que la corriente /(7) en un circuito cerrado que con- 
tiene una resistencia de R ohms, una capacitancia de C faradios, una inductancia de £ henrios 
y una fuente voltaje de E(f) volts satisface la ecuación 


ІГ) +RI() + с/!® dt = E(t). 


Las corrientes 7; (t) y 2 (7) en los ciclos izquierdo y derecho, respectivamente, del circuito 
mostrado en la figura 5.7 son las soluciones para el sistema de ecuaciones 


210) + 6[1(@) – 2(0)] +2 (0) = 12, 


1 
53 / ьи) de tiny +6000) — 10] =0. 
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Figura 5.7 


Si el interruptor en el circuito está cerrado en el tiempo £ = 0, tenemos las condiciones ini- 
ciales 1,(0) = 0 y /5(0) = 0. Resuelva рага [| (t) en la primera ecuación, al derivar la segunda 
ecuación y sustituyendo para T{ (t) se obtiene 


l=f0,h,b)=-41+3L+6, 1(0)=0, 
L = h(t, h, b) =0.61, — 02h =-2.41, +1.6h +3.6, 100) = 0. 


La solución exacta para este sistema es 
L(t) = —3.375e 7” + 1.875е 9% + 1.5, 
D(t) = —2.25e7%” + 2.25“. 


Aplicaremos el método Runge-Kutta de orden 4 para este sistema con h = 0.1. Puesto que 
изо = A (0) =0 y w20 = L(0) = 0, 


Кыл = hfi (to, w1,0, w2,0) = 0.1 fi (0, 0,0) = 0.1 (—4(0) + 3(0) + 6) = 0.6, 
ki 2 = hfa(fo, ито, W20) = 0.1 £,(0, 0,0) = 0.1 (-2.4(0) + 1.6(0) + 3.6) = 0.36, 


1 1 1 
kai = hfi ( + 5» w1,0 + укы ло + o) =0.1 f,(0.05, 0.3, 0.18) 
= 0.1 (—4(0.3) + 3(0.18) + 6) = 0.534, 
1 1 1 
k22 = hf | to + 7% ито + экы, w2o0 + ¿42 = 0.1 f,(0.05, 0.3, 0.18) 
= 0.1 (22.4(0.3) + 1.6(0.18) + 3.6) = 0.3168. 
Al generar las entradas restantes de manera similar obtenemos 


kı = (0.1) fı (0.05, 0.267, 0.1584) = 0.54072, 
k32 = (0.1) f (0.05, 0.267, 0.1584) = 0.321264, 

Кал = (0.1) fı (0.1, 0.54072, 0.321264) = 0.4800912, 
k42 = (0.1) f (0.1, 0.54072, 0.321264) = 0.28162944. 


Como consecuencia, 
1 
10.) ~ ү = w1, + gén +201 + 2031 + К) 


1 
= 0 + ¿(0.6 + 200.534) + 2(0.54072) +0.4800912) = 0.5382552 
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Tabla 5.19 


Ejemplo 1 


= Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


1 
L(0.1) Xw = wW2.0 + ¿E + 2k22 + 2532 + k42) = 0.3196263. 


Las entradas restantes en la tabla 5.19 se generan de manera similar. 


tj Wi,j W2,j (0) = №13] (0) — w2 jl 
0.0 0 0 0 0 

0.1 0.5382550 0.3196263 0.8285 х 10? 0.5803 х 1075 
0.2 0.9684983 0.5687817 0.1514 х 1074 0.9596 х 1075 
0.3 1.310717 0.7607328 0.1907 х 1074 0.1216 х 107* 
04 1.581263 0.9063208 0.2098 х 1074 0.1311 x 107* 
0.5 1.793505 1.014402 0.2193 х 1074 0.1240 х 107* 


Ecuaciones diferenciales de orden superior 


Muchos problemas físicos importantes, por ejemplo, circuitos eléctricos y sistemas de vibra- 
ción, implican problemas de valor inicial cuyas ecuaciones tienen Órdenes mayores que 1. 
No se requieren técnicas nuevas para resolverlos. Al reetiquetar las variables podemos redu- 
cir una ecuación diferencial de orden superior en un sistema de ecuaciones diferenciales de 
primer orden y, a continuación aplicar uno de los métodos que ya analizamos. 

Un problema de valor inicial de m-ésimo orden general 


YPAS EN), а<т<Ь, 


con condiciones iniciales y(a) = 01, y (a) =0%),..., y "=D (a) = о, se pueden convertir 
en un sistema de ecuaciones de la forma (5.45) y (5.46). 

Si u(t) = y(t), u(t) =y (0), ..., y Unlt) = y" (t). Esto produce el sistema de 
primer orden 


du; dy duz dy' dum- dym-2 
—— = —— = н), —— = —— = из, ..., = = Um» 
dt dt dt dt dt dt 
y 
dum dy”) 
m y = у? = f(t, у, y... YTD) = f(t, U1, U2, ..., Um), 


dt dt 


con condiciones iniciales 


u(a) = у(а) = о, иг(а) = у (а) =00, ..., Uunla)=y" "(a)=0m. 


Transforme el problema de valor inicial de segundo orden 
у” —2y' + 2у = e” sent, 


para0 <t < 1, con y(0) = —0.4, у'(0) = —0.6 


en un sistema de problemas de valor inicial de primer orden y use el método Runge-Kutta 
con Л = 0.1 para aproximar la solución. 


Solución Seau¡(t) = y(t) y uz(t) = у'(ї). Esto transforma la ecuación de segundo orden 
en el sistema 


u(t) = и›@), 


us (t) = e” sent — 2u (t) + 2u2(0), 


con condiciones iniciales иу (0) = —0.4, u2(0) = —0.6. 
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Las condiciones iniciales dan w1 y = —0.4 y w20 = —0.6. Las ecuaciones (5.49) a 
(5.52) en la página 249 con j = О proporcionan 


Кул = hfi (to, w1,0, W2,0) = hw2o = —0.06, 


Кә = АР (00, то, W2,0) = h [е2 sen tọ — 210 +2w20] = —0.04, 


h 1 1 1 
ka1=hf ( + ¿> WLO + экы, w2, + а) =k [wzo + TH = —0.062, 


h 1 1 
kaz = р (a + z WLO + эк, w2, + tua) 


1 1 
= h |е20+0:05) sen(to + 0.05) — 2 (mio + а) +2 (12: + 9] 


= —0.03247644757, 


Г 1 
Кз = h |w20 + ¿a = —0.06162832238, 


Г 1 1 
Кз = h |e200+00 сеп (to + 0.05) — 2 (ri + zt) +2 (1020 + 9) 


= —0.03152409237, 


кал = h [уло +62] = —0.06315240924, 


y 


Као = h [e200+0D веп(% + 0.1) — 2(w1.0 + Кз) + 20020 + k3,2)] = —0.02178637298. 


Por lo que, 
1 
wit = 1,0 + ©з + 201 + 2031 + k41) = —0.4617333423 
1 
юл = w20 + ¿(ra + 2® + 2032 аз) = —0.6316312421. 


El valor м, аргохїта и1(0.1) = y(0.1) = 0.2e?®™D(sen0.1 — 2 соз 0.1), у м» apro- 
хіта u2(0.1) = y'(0.1) =0.2e?20-D(4sen0.1 — 3 cos 0.1). 


El conjunto de valores уу, j y мо, у, para j = 0, 1,..., 10, se presenta en la tabla 5.20 

y se comparan con los valores reales de u; (t) = 0.2e” (sent — 2 cost) y u(t) = u (1) = 

0.2e” (4sen t — З cost). п 
Tabla 5.20 
tj y(t;) =u41(t;) Wij y'(t;) = ur (t;) Wa, j ly) = №13] ly (E) — wa jl 
0.0 —0.40000000 —0.40000000 —0.6000000 —0.60000000 0 0 
0.1 —0.46173297 —0.46173334 —0.6316304 —0.63163124 3.7 х 1077 7.75 x 1077 
0.2 —0.52555905 —0.52555988 —0.6401478 —0.64014895 8.3 x 1077 1.01 x 1076 
0.3 —0.58860005 —0.58860144 —0.6136630 —0.61366381 1.39 х 107% 8.34 х 107” 
0.4 —0.64661028 —0.64661231 —0.5365821 —0.53658203 2.03 х 107% 1.79 х 1077 
0.5 —0.69356395 —0.69356666 —0.3887395 —0.38873810 2.71 x 107% 5.96 x 1077 
0.6 —0.721 14849 —0.72115190 —0.1443834 —0.14438087 3.41 x 107% 775x107 
0.7 —0.71814890 —0.71815295 0.2289917 0.22899702 4.05 х 1076 2.03 х 107% 
0.8 —0.66970677 —0.66971133 0.77198 15 0.77199180 4.56 х 10-6 5.30 х 107% 
0.9 —0.55643814 —0.55644290 1.534764 1.5347815 4.76 х 107% 9.54 х 107% 
1.0 —0.35339436 —0.35339886 2.578741 2.5787663 4.50 х 107% 1.34 х 1077 
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Los otros métodos de un paso se pueden extender a los sistemas de manera similar. 
Cuando los métodos de control de error como el Runge-Kutta-Fehlberg son extendidos, a 


cada componente de la solución numérica (w1 у, W2j, ..., Wmj) se debe examinar su preci- 
sión. Si cualquiera de los componentes no es suficientemente preciso, toda la solución numé- 
rica (W1j, W2j, -.-, Wmj) se debe volver a calcular. 


Los métodos multipasos y las técnicas de indicador-corrector también se pueden 
ampliar a los sistemas. De nuevo, si se utiliza control de error, cada componente debe ser pre- 
ciso. La extensión de la técnica de extrapolación para los sistemas también se puede realizar, 
pero la notación se vuelve bastante implicada. Si este tema es de interés, consulte [HNW1]. 

Los teoremas de convergencia y estimación de error para sistemas son similares a los 
considerados en la sección 5.10 para las ecuaciones individuales, excepto que las cotas están 
dadas en términos de normas de vectores, un tema considerado en el capítulo 7 (una buena 
referencia para estos teoremas es [Gel], р. 45—72). 


La sección Conjunto de ejercicios 5.9 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


FEN 5.10 Estabilidad 


Definición 5.18 


Un método de un paso es 
consistente si la ecuación de 
diferencia para el método se 
enfoca en la ecuación diferencial, 
conforme el tamaño de paso 
tiende a cero. 


Definición 5.19 


Un método es convergente 

si la solución de la ecuación 

de diferencia se enfoca en 

la solución de la ecuación 
diferencial conforme el tamaño 
de paso tiende a cero. 


En este capítulo se ha presentado una serie de métodos para aproximar la solución para un 
problema de valor inicial. A pesar de que existen otras técnicas, seleccionamos los métodos 
descritos aquí porque, en general, satisfacen tres criterios: 


e Su desarrollo es suficientemente claro, por lo que se puede comprender cómo y por qué 
funcionan. 


e Uno o más métodos proporcionarán resultados satisfactorios para muchos de los proble- 
mas encontrados por los estudiantes de ciencias e ingeniería. 


e Muchas de las técnicas más avanzadas y complejas están basadas en una o varios de los 
procedimientos descritos aquí. 


Métodos de un paso 


En esta sección analizamos porqué se espera que estos métodos proporcionen resultados satisfac- 
torios cuando métodos similares no lo hacen. Antes de empezar este análisis, necesitamos presen- 
tar dos definiciones relacionadas con la convergencia de los métodos de ecuación de diferencia 
de un paso para la solución de esa ecuación diferencial conforme el tamaño de peso disminuye. 


Se dice que un método de ecuación de diferencia de un paso con error de truncamiento local 
Ti (h) en el i-ésimo paso es consistente con la ecuación diferencial que aproxima si 


lím máx |т;(Л)| = 0. ш 
һ—0 1<i<N 
Observe que esta definición es una definición local ya que, рага cada uno de los valores 
т; (Л), suponemos que la aproximación w;-1 y la solución exacta y (t;-1) es la misma. Un 
medio más realista para analizar los efectos de reducir h es determinar el efecto global del 
método. Éste es el error máximo del método sobre todo el rango de la aproximación, al su- 
poner solamente que el método da el resultado exacto en el valor inicial. 


Se dice que un método de ecuación de diferencia de un paso es convergente respecto a la 
ecuación diferencial que aproxima si 


lím máx |w; — y(t)| = 0 
Шш pax ld у@)| = 0, 


donde y(t;) denota el valor exacto de Іа solución de la ecuación diferencial у w; es la aproxi- 
mación obtenida a partir del método de diferencia en el ¡-ésimo paso. п 


Ejemplo 1 


Un método es estable cuando 
los resultados dependen 
continuamente de los datos 
iniciales. 


5.10 Estabilidad 255 


Muestre que el método de Euler es convergente. 


Solución Examine la desigualdad (5.10) en la página 202, en la fórmula de la cota de error 
para el método de Euler, nosotros observamos que bajo la hipótesis del teorema 5.9 


Mh , 
А КЕТ PAn (ba) _ 
máx |; ус) < э]. е Ц. 


Sin embargo, М, L у b son todas las constantes, у 


- А -~ МА | a) 

lím máx |w; — у()1 < lím — |е — 1| =0. 
h>0 1<i<N һ=0 2L 

De modo que el método de Euler es convergente respecto a una ecuación diferencial que 

satisface las condiciones de esta definición. La razón de convergencia es O(h). ш 


Un método consistente de un paso tiene la propiedad de que la ecuación de diferencia 
para el método aproxima la ecuación diferencial cuando el tamaño de paso tiende a cero. Por 
lo que el error de truncamiento local de un método consistente se aproxima a cero conforme 
el tamaño de paso se aproxima a cero. 

El otro tipo de cota de error del problema que existe al usar métodos de diferencia o 
soluciones aproximadas para las ecuaciones diferenciales es una consecuencia de no usar 
resultados exactos. En la práctica, ni las condiciones iniciales ni la aritmética que se realiza 
por consiguiente se representan de manera exacta debido al error de redondeo asociado con 
la aritmética de dígitos finitos. En la sección 5.2 observamos que esta consideración puede 
conducir a dificultades incluso para el método convergente de Euler. 

Para analizar esta situación, por lo menos en parte, tratamos de determinar los métodos 
que son estables en el sentido de que cambios pequeños o perturbaciones en las condiciones 
iniciales producen proporcionalmente pequeños cambios en las aproximaciones subsiguientes. 

El concepto de estabilidad de una ecuación de diferencia de un paso es de alguna forma 
análoga para la condición de una ecuación diferencial bien planteada, por lo que no es sor- 
prendente que la condición de Lipschitz aparezca aquí, como lo hizo en el teorema corres- 
pondiente para ecuaciones diferenciales, el teorema 5.6 en la sección 5.1. 

La parte 1) del siguiente teorema se preocupa por la estabilidad de un método de un paso. 
La prueba de este resultado no es difícil y se considera en el ejercicio 1. La parte 11) del teo- 
rema 5.20 se preocupa por condiciones suficientes para que un método consistente sea con- 
vergente. La parte iii) justifica la observación realizada en la sección 5.5 sobre controlar el 
error global de un método al controlar su error de truncamiento local e implica que cuando 
el error de truncamiento local tiene una razón de convergencia O(h”), el error global tendrá 
la misma razón de convergencia. Las pruebas de las partes 11) y 111) son más difíciles que las 
de la parte i) y se pueden encontrar dentro del material presentado en [Gel], р. 57-58. 


Teorema 5.20 Suponga que el problema de valor inicial 


y =f(t,y) ast<sb, y(a)=a, 
se aproxima por medio de un método de diferencia de un paso de la forma 


Wo = Q, 


wi + họ (ti, wi, h). 


Wi+1 


También suponga que existe un número ho > 0 y que p(t, у, h) es continua y que satisface 
la condición de Lipschitz en la variable w con constante £ de Lipschitz en el conjunto 


D=1((t,w,h)|la<t<by-o0o0<w<0o,0<huh<hp). 


256 CAPÍTULO 5 = Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


Entonces 
i) El método es estable; 


ii) El método de diferencia es convergente si y sólo si es consistente, lo cual es equiva- 
lente a 


p(t,y,0)= F(t, y), рага todas las a < t < b; 


iii) Si existe una función т y, para cada į = 1,2,... , N, el error de truncamiento local 
ti (Л) satisface |t; (A)| < t (h) siempre que 0 < h < ho, entonces 


т(Л) Неа 
й) =W¡|< е. 

lyt) — wil r“ 

Ejemplo 2 El método modificado de Euler está dado por wo = Y, 


h 
иы = Wi + z ПР wi) + Ры, wi +Af (ti, wi))], parai=0,1,...,N—1. 


Verifique que este método es estable al mostrar que satisface la hipótesis del teorema 5.20. 


Solución Para este método 
1 1 
p(t,w,h) = ¿46 уу) + ÁS +h,w+hf(t, w)). 


Si f satisface la condición de Lipschitz en [ (7, и) | a <t < ру — оо <w < oojen 
la variable w con constante L, entonces, puesto que 


1 1 
p(t,w,h) = p(t, w, h) = 976%) Р ¿FE +h, w +hf(t, w)) 
1 ol __ = 
la condición de Lipschitz en f conduce a 
e 1 | ЕЕ Р? 


< Liw 9) + EL fE, w) — Af) 


1 

< Liw WI + ¿hi w w] 
ШКЕ, _ 

= DARE |w = w]. 


Por lo tanto, ф satisface la condición de Lipschitz en w en el conjunto 
[(t,w,h)[a<t<b,-o<w=<o0o y0<h< ho), 


para cualquier ho > O con constante 
/ 1 2 
Г, =1,+ ¿hol т 


Finalmente, si f es continua en { (Т, и) | а < t < Ь,—оо < w < œ}, entonces ф 
es continua en 


[(,w,h)|a<t<b,-=o00<w<00, y0<h< ho), 
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por lo que el teorema 5.20 implica que el método modificado de Euler es estable. Al hacer 
h = 0, tenemos 


1 1 
pw, 0) = „/@»)+„/@+0,» +0. Л м) = few), 


por lo que la condición de consistencia expresada en el teorema 5.20, parte 11), se mantiene. Рог 
lo tanto, el método es convergente. Además, hemos visto que para este método, el error de 
truncamiento local es O(h?), рог lo que la convergencia del método modificado de Euler 
también es О(А2). m 


Métodos multipasos 


Para métodos multipasos, los problemas relacionados con la consistencia, la convergencia y 
la estabilidad son compuestos debido al número de aproximaciones que implica cada paso. 
Mientras en los métodos de un paso, la aproximación э; ү depende directamente sólo de la 
aproximación previa w;, los métodos multipasos utilizan por lo menos dos de las aproxima- 
ciones previas y los métodos comunes utilizados implican más. 

El método general multipasos para aproximar la solución del problema de valor inicial 


y =f(,y) ast<b, y(a)=0, (5.54) 
tiene la forma 
wọ = Q, wi = 01, ‚++, Wm-1 = Am-1> 
Wit = am-1Wi + Am-2Wj-1 + + адут FAF (Gi, h, Wists Wiss ee Ист)» 
(5.55) 
para сайа і = m — 1, т,..., N — 1, donde ap, 41,... ,dm+1 son constantes, y como 


siempre, h = (b—a)/N y ti =a + ih. 
El error de truncamiento local para un método multipasos expresado en esta forma es 


ti — Um— fi) = ti+1—m 
tatis Y(ti+1) = Am-1y (ti) абу (ti+1-m) 
h 
= F (th, Yia) УО), ... Yiia) 
рага сайат = m — 1,m,...,N — 1. Como en los métodos de un paso, el error de trun- 


camiento local mide la forma en la que la solución y para la ecuación diferencial no puede 
satisfacer la ecuación de diferencia. 
Por el método Adams-Bashforth de cuatro pasos, hemos observado que 


data т, 1 КЄ (liza, t 
mh) = 77) (mi)h*, para algunos ш; Є (ti-3, +1), 


mientras que el método Adams—Moulton de tres pasos se tiene 


ca Pp 
Tii (h) == ht, рага algunas и € (=з, fis), 


siempre y cuando, por supuesto, y e C%[a, b]. 
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Teorema 5.21 


A lo largo del análisis, se realizan dos suposiciones respecto a la función F: 


e Si f =0 (es decir, si la ecuación diferencial es homogénea), entonces F = 0 también. 


e F satisface la condición de Lipschitz respecto a {w ;} en el sentido de que existe una cons- 


tante L, y, para cada par de secuencias tuto y F o y para i =m – l,m,...,N — 1, 
tenemos 
m 
(1, ћ, о, + Vipin) = F rh; Dipte Digiom)l E L › рыу = дл l. 
j=0 


Los métodos Adams-Bashforth explícito y Adams-Moulton implícito satisfacen ambas 
condiciones, siempre que f satisfaga la condición de Lipschitz (consulte el ejercicio 2). 

El concepto de convergencia para métodos multipasos es el mismo que para los métodos 
de un paso. 


e Un método multipasos es convergente si la solución de la ecuación de diferencia se apro- 
xima a la solución de la ecuación diferencial conforme el tamaño de paso se aproxima a 
cero. Esto significa que Ито Máxo<i<w | wi — y(ti)| = 0. 


Para la consistencia, sin embargo, se presenta una situación algo diferente. De nuevo, 
queremos que un método multipasos sea consistente siempre que la ecuación de diferencia se 
aproxime a la ecuación diferencial conforme el tamaño de paso se aproxima a cero; es decir, 
el error de truncamiento local se aproxima a cero en cada paso conforme el tamaño de paso 
se aproxima a cero. La condición adicional se presenta debido al número de valores iniciales 
requerido para los métodos multipasos. Puesto que, normalmente, sólo el primer valor inicial 
wo = о, es exacto, necesitamos requerir que los errores en todos los valores iniciales {œ;} se 
aproximen a cero conforme el tamaño de paso se aproxima a cero. Por lo que, 


lím [7,(4)1 = 0, para toda і = т, т + 1,..., N, y (5.56) 


Ті lo; — у(%)| = 0, paratodai=1,2,...,m-—l, (5.97) 


debe ser verdadero рага que un método multipasos de Іа forma (5.55) sea consistente. Ob- 
serve que la ecuación (5.57) implica que un método multipasos no será consistente a menos 
que el método de un paso que genera los valores iniciales también sea consistente. 

El siguiente teorema para los métodos multipasos es similar al teorema 5.20, parte 111), 
y provee una relación entre el error de truncamiento local y el error global de un método 
multipasos. Este proporciona la justificación teórica para intentar controlar el error global 
al controlar el error de truncamiento local. La demostración de una forma ligeramente más 
general de este teorema se puede encontrar en [IK], p. 387-388. 


Suponga que se aproxima el problema de valor inicial 
y =f(,y) ast<b, у(а) =а, 


con un método indicador-corrector explícito de Adams con una ecuación indicadora de 
Adams-Bashforth de m pasos 


Wir = Wi + Ара РО, wi) + <+- + bof (б-т Wi+1mDl, 


con error de truncamiento local т;+1(й), y una ecuación correctora implícita de Adams- 
Moulton de (m — 1) pasos 


иы = +A [bmi f (tizi Wii) + Bm f (ti, Wi) + +++ + Do Рот аот), 
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con error de truncamiento local 7, | | (Л). Además, suponga que f(t, y) y f,(t, y) son conti- 
nuas еп D = { (t, у) [а <t < ру –оо < у < œ} y f está acotada. Entonces, el error de 
truncamiento local о; (A) del método indicador corrector es 


Ра д 
E E S A а tú: 


donde Ө; еѕ un número entre cero y лт; (л). 
Además, existen constantes kı y Ко tal que 


|w; = y (t;)| < б máx lwj = y(t;)| + kio (h) ею@-а), 


<j<m-1 


donde øo (h) = MåáXm<j<n |0; (й). ш 


Antes de analizar las conexiones entre consistencia, convergencia y estabilidad para 
los métodos multipasos, necesitamos considerar con más detalle la ecuación de diferencia 
para un método multipasos. Al hacerlo, descubriremos la razón para seleccionar los métodos 
Adams como nuestros métodos multipasos estándar. 

Relacionado con la ecuación de diferencia (5.55) provisto al inicio de este análisis, 


W=0, W1 S= 1, ..., Wm-1 = m-l, 


Wii = Am—1Wi + am-2Wi-1 +5 + аот + hF (ti, h, м, Wis <-> Wi¡41=m)» 
es un polinomio, llamado polinomio característico del método, dado por 
Р(А) = O С! ЕБ йаа == аА — а0. (5.58) 


La estabilidad de un método multipasos respecto al error de redondeo está dictada рог 
las magnitudes de los ceros del polinomio característico. Para observar esto, considere apli- 
car el método multipasos estándar (5.55) al problema trivial de valor inicial 


у= 0, у(а) = а, donde a #0. (5.59) 


Este problema tiene solución exacta y(t) = о. Al examinar las ecuaciones (5.27) y (5.28) 
en la sección 5.6 (consulte las páginas 226 y 227), podemos observar que cualquier método 
multipasos producirá, en teoría, la solución exacta w, = о para todas las n. La única desvia- 
ción de la solución exacta se debe al error de redondeo del método. 

El lado derecho de la ecuación diferencial en (5.59) tiene f(t, y) = 0, por lo que me- 
diante la suposición (1), tenemos F (ti, h, Wi+1, мро, ++. , Wi+1=m) = 0 en la ecuación de 
diferencia (5.55). Como consecuencia, la forma estándar de esta ecuación se convierte en 


Wi+1 = Ят- 10; + am-2Wi-1 +: + A0Wi+lm- (5.60) 


Suponiendo que A es uno de los ceros del polinomio característico relacionado con la 
ecuación (5.55). Entonces w, = A” para cada n es una solución para la ecuación (5.59) ya 
que 


ліні _ аһ дА та аһ 2А! а алі" = ктүн _ ЖИЕ, л CE PORE ao] = 0. 


En efecto, 51 Ау, А, ... , А Son raíces distintas del polinomio característico para la ecuación 
(5.55) se puede mostrar de que todas las soluciones de la ecuación (5.60) se pueden expresar 
en la forma 


m 


и„= Y cih}, (5.61) 


i=1 


para algún conjunto único de constantes с, C2,... , Cm. 
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Definición 5.22 


Definición 5.23 


Puesto que la solución exacta рага la ecuación (5.59) es y(t) = а, la selección w, = а, 
para todas las n, es una solución para la ecuación (5.60). Usando este hecho en la ecuación 
(5.60) obtenemos 


О=@ Aadm-1 аат-2 e ad = afl Am-1 Am-2 к= ao]. 


Esto implica que à = 1 es uno de los ceros del polinomio característico (5.58). Supondre- 
mos que en la representación (5.61), esta solución está descrita por Ау = 1 ус = а, por lo 
que todas las soluciones de la ecuación (5.59) se expresan como 


m 
Wn =Q + У сә. (5.62) 

¡=2 
Si todos los cálculos fueran exactos, todas las constantes сә, C3,... ,Cm Serían cero. En la 
práctica, las constantes сә, C3,... , Cp по son cero debido al error de redondeo. De hecho, 
el error de redondeo crece de manera exponencial a menos que |A;| < 1 para cada una de 
las raíces А2, 43, ... , Am. Mientras más pequeña sea la magnitud de estas raíces, más estable 


será el método respecto al crecimiento del error de redondeo. 

Al derivar la ecuación (5.62) realizamos la suposición simplificadora de que los ceros 
del polinomio característico son distintos. La situación es similar cuando se presentan múlti- 
ples ceros. Por ejemplo, si Ак = Ax41 = + ++ = Àk+p para algunas k y p, simplemente requiere 
reemplazar la suma 


Cr + Ck+1 Ал +. + Ck+påk+p 
en (5.62) con 


n—p 


ср" + Cana + cepon (n — А? + +++ cepli — 1)---(n— p+ DIA; 

(5.63) 

(Consulte [He2], p. 119-145). A pesar de que se modifica la forma de la solución, el error de 
redondeo |A¿| > 1 sigue creciendo exponencialmente. 

Aunque sólo hemos considerado el caso especial de aproximación de los problemas 
de valor inicial de la forma (5.59), las características de estabilidad para esta ecuación de- 
terminan la estabilidad de la situación cuando ft, y) no es idénticamente cero. Esto porque 
la solución para la ecuación homogénea (5.59) está integrada en la solución de cualquier 
ecuación. Las siguientes definiciones están motivadas por este análisis. 


SiA1,A42,... , Аъ denota las raíces (no necesariamente distintas) de la ecuación característica 


POJ =" = dy A === =0 


relacionada con el método de diferencias multipasos 


Wo = Q, wi = 1, e...’ Wm-1 = Am-—1 
Wi+1 = Am-1Wj + Ap-2Wi-1 + А аот + AF (ti, h, м, Wis.. Ит). 
Si |à;| < 1, para cada i = 1,2,... ‚т, y todas las raíces con valor absoluto 1 son raíces 
simples, entonces se dice que el método de diferencia satisface la condición de raíz. п 


i) Los métodos que satisfacen la condición de raíz y tienen А = 1 сото la única raíz 
de la ecuación característica con magnitud uno reciben el nombre de firmemente 
estables. 


ii) Los métodos que satisfacen la condición de raíz y tienen más de una raíz distinta con 
magnitud uno reciben el nombre de débilmente estables. 


iii) Los métodos que no satisfacen la condición de raíz reciben el nombre de inestables. 
ш 


Definición 5.24 


Ejemplo 3 


Ejemplo 4 


Ejemplo 5 
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La consistencia y convergencia de un método multipasos están relacionadas de cerca con la 
estabilidad del redondeo del método. El siguiente teorema detalla estas conexiones. Para 
la demostración de este resultado y la teoría en la que está basado, consulte [IK] p. 410-417 


Un método multipasos de la forma 


wọ = Q, wi S= 01, э, Wm-1 = Am-1> 


Wi+1 = Am-1Wi + am—2Wi-1 +*+ + ару +1—-т + AF (ti, h, Witi, Wis... Ит) 


es estable si y sólo si satisface la condición raíz. Además, si el método de diferencia es con- 
sistente con la ecuación diferencial, entonces el método es estable si y sólo si es convergente. 


E 

El método Adams—Bashforth de cuarto orden se puede expresar como 
Жы = FAF(t,h,Wig1, Wis... Wi-3), 
donde 
воа) = 20557 (з) — 591, илл) 
+37 f (1-2, wi-2) = 9 fti-s, Wi-3)]. 

Muestre que este método es firmemente estable. 
Solución Еп este caso, tenemos т = 4, ао = 0, а = 0, a = 0 уаз = 1, por lo que 


la ecuación característica para este método Adams-Bashforth es 


0 = Р(А) = А А = А(А – 1). 


Este polinomio бепе raíces А = 1, А = 0, Аз = 0 у А4 = О. Por lo tanto, satisface la con- 
dición de raíz y es firmemente estable. 

El método Adams—Moulton tiene un polinomio característico similar, P (à) = Pa, 
con ceros Ау = 1, А = 0 y 43 = 0, y también es firmemente estable. п 


Muestre que el método Milne de cuarto orden, el método explícito multipasos provisto por 


4h 
иы = мз + 3 BIGi wd = Рл, w¡1) +2 (t¡-2, w¡-2)], 


satisface la condición raíz, pero sólo es débilmente estable. 


Solución La ecuación característica para este método 0 = P(A) = àf — 1, tiene cuatro 
raíces con magnitud 1: А = 1, № = —1, Аз = i, y А = —1. Puesto que todas las raíces 
tienen magnitud 1, el método satisface la condición de raíz. Sin embargo, existen raíces múl- 
tiples con magnitud 1, por lo que el método es débilmente estable. п 


Aplique el método Adams-Bashforth de cuarto orden firmemente estable y el método Milne 
débilmente estable con h = 0.1 para el problema de valor inicial 


y =-6y+6, O<t<l, y0)=2, 


que tiene la solución exacta y(t) = 1 +.e"%, 


Solución Los resultados en la tabla 5.21 muestran los efectos de un método débilmente 
estable versus uno firmemente estable para este problema. п 


262 CAPÍTULO 5 = Problemas de valor inicial para ecuaciones de diferenciales ordinarias 


Tabla 5.21 


Método Método de 
Exacto Adams-Bashforth Error Milne Error 
ti y(ti) Wi ly; — wil Wi ly; — wil 

0.10000000 1.5488116 1.5488116 
0.20000000 1.3011942 1.3011942 
0.30000000 1.1652989 1.1652989 
0.40000000 1.0907180 1.0996236 8.906 x 107° 1.0983785 7.661 x 107° 
0.50000000 1.0497871 1.0513350 1.548 x 107° 1.0417344 8.053 х 107° 
0.60000000 1.0273237 1.0425614 1.524 x 10? 1.0486438 2.132 x 10? 
0.70000000 1.0149956 1.0047990 1.020 х 1072 0.9634506 5.154 х 10? 
0.80000000 1.0082297 1.0359090 2.768 х 10? 1.1289977 1.208 х 107! 
0.90000000 1.0045166 0.9657936 3.872 х 10? 0.7282684 2.762 х 107! 
1.00000000 1.0024788 1.0709304 6.845 х 1072 1.6450917 6.426 х 107! 


La razón рага seleccionar el método Adams—Bashforth-Moulton como nuestra técnica 
indicador-corrector de cuarto orden en la sección 5.6 sobre el método del Milne-Simpson 
del mismo orden es que tanto el método Adams-Bashforth como el Adams-Moulton son fir- 
memente estables. Estos tienen más posibilidades de proporcionar aproximaciones precisas 
para una clase más amplia de problemas que el método indicador-corrector con base en las 
técnicas de Milne y Simpson, ambos débilmente estables. 


La sección Conjunto de ejercicios está disponible en línea. Encuentre la ruta de acceso 
en las páginas preliminares. 


Los sistemas rígidos derivan 
su nombre del movimiento de 
sistemas de masa-resorte que 
tienen grandes constantes de 
resorte. 


Ecuaciones diferenciales rígidas 


Todos los métodos para aproximar la solución de los problemas de valor inicial tienen tér- 
minos de error que implican una derivada superior de la solución de la ecuación. Si se puede 
acotar de manera razonable la derivada, entonces el método tendrá una cota de error previsi- 
ble que se puede utilizar para calcular la precisión de la aproximación. Incluso si la derivada 
aumenta conforme los pasos aumentan, el error se puede mantener en control relativo, siem- 
pre y cuando la solución también crezca en magnitud. Sin embargo, con frecuencia surgen 
problemas cuando la magnitud de la derivada aumenta, pero la solución no lo hace. En esta 
situación, el error puede aumentar tanto que domina los cálculos. Los problemas de valor ini- 
cial para los que es probable que esto se presente reciben el nombre de ecuaciones rígidas y 
son bastante comunes, de modo especial en el estudio de vibraciones, reacciones químicas 
y circuitos eléctricos. 

Las ecuaciones diferenciales rígidas se caracterizan como aquellas cuya solución exacta 
tiene un término de la forma е“, donde с es una constante positiva grande. Normalmente, 
esto sólo es una parte de la solución, llamada solución transitoria. La parte más importante 
de la solución se llama solución de estado estable. La parte transitoria de una ecuación rígida 
tiende rápidamente a cero conforme ѓ aumenta, pero debido а que la enésima derivada de 
este término tiene magnitud c”e”“, la derivada no decae tan rápido. De hecho, puesto que 
la derivada en el término de error se evalúa no en 7 sino en un número entre cero у t, los 
términos derivados pueden incrementar conforme f aumenta, y por cierto, de manera muy 
rápida. Afortunadamente, en general, las ecuaciones rígidas se pueden predecir a partir de 
un problema físico, desde el que se derivan las ecuaciones, y, con cuidado, el error se puede 
mantener bajo control. La manera en la que esto se hace se considera en esta sección. 


Ilustración 


Tabla 5.22 
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El sistema de problemas de valor inicial 
Т 1 4 
u = Zuk Mio a E sent; а= 
y 1 2 
u, = —24u1 = 580 — 9cost + z sent, и2(0) = 3 
tiene la única solución 
1 1 
ut) = 20% — 4 Б cost, u(t) = –е + 2е7% — 3 cost. 


El término transitorio е3 en la solución causa que este sistema sea rígido. Al aplicar el 


algoritmo 5.7, el método Runge-Kutta de cuarto orden para sistemas, da los resultados lista- 
dos en la tabla 5.22. Cuando h = 0.05, los resultados de estabilidad y las aproximaciones son 
precisas. Al incrementar el tamaño de paso a h = 0.1, sin embargo, conduce a los resultados 


desastrosos mostrados en la tabla. ш 
w(t) w(t) wa(t) wa(t) 

t u(t) h = 0.05 h=0.1 и›@) h = 0.05 h=0.1 
0.1 1.793061 1.712219 —2.645169 — 1.032001 —0.8703152 7.844527 
0.2 1.423901 1.414070 —18.45158 —0.8746809 —0.8550148 38.87631 
0.3 1.131575 1.130523 —87.47221 —0.7249984 —0.7228910 176.4828 
0.4 0.9094086 0.9092763 —934.0722 —0.6082141 —0.6079475 789.3540 
0.5 0.7387877 9.7387506 — 1760.016 —0.5156575 —0.5155810 3520.00 
0.6 0.6057094 0.6056833 —7848.550 —0.4404108 —0.4403558 15697.84 
0.7 0.4998603 0.4998361 — 34989.63 —0.3774038 —0.3773540 69979.87 
0.8 0.4136714 0.4136490 —155979.4 —0.3229535 —0.3229078 311959.5 
0.9 0.3416143 0.3415939 —695332.0 —0.2744088 —0.2743673 1390664. 
1.0 0.2796748 0.2796568 — 3099671. —0.2298877 —0.2298511 6199352. 


Aunque a menudo la rigidez se relaciona con los sistemas de ecuaciones diferenciales, 
las características de la aproximación de un método numérico particular aplicado a un sis- 
tema rígido se pueden predecir al examinar el error producido cuando se aplica el método a 
una ecuación de prueba simple, 


у= Ау, y0)=0, donde A < 0. (5.64) 


La solución para esta ecuación es y(t) = ае“, que contiene la solución transitoria е^“. La 
solución de estado estable es cero, por lo que las características de un método son fáciles 
de determinar. (Un análisis más completo del error de redondeo relacionado con sistemas 
rígidos requiere examinar la ecuación de prueba cuando A es un número complejo con parte 
real negativa; consulte [Gel], р. 222.) 

Primero, considere el método de Euler aplicado a la ecuación de prueba. Sih = (b —a)/N 
yt; = ¡h,paraj=0,1,2,..., N, la ecuación (5.8) en la página 266 implica que 


W=0, у иы = иу (А) = (1 АА) у, 
рог lo que 
wj = (1 + АА) ио =(1+D о, paraj=0,1,...,N—1. (5.65) 
Puesto que la solución exacta es y(t) = ae”, el error absoluto es 


|у@ ) = wil = [e> — АА) | la] = [e — (1 АА) la, 
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y la precisión se determina por qué tan bien el término 1-+Е Л. aproxima е'^. Cuando A < 0, la 
solución exacta (ei tiende a cero conforme j aumenta, pero con la ecuación (5.65), la apro- 
ximación tendrá esta propiedad sólo si [1 + ЛАД < 1 , lo cual implica que —2 < hà < 0. 
Esto restringe efectivamente el tamaño de paso h para el método de Euler para satisfacer 
h<2/|A). 

Ahora, suponga que se introduce un error de redondeo до en la condición inicial para el 
método de Euler, 


Wo = © + до. 
En el j-ésimo paso, el error de redondeo es 
ô; = (1+ hà)! ôo. 


Puesto que А < 0, la condición рага el control del crecimiento del error de redondeo es 
la misma que la condición para controlar el error absoluto |1-+ЕЛА| < 1, que implica que 
h < 2/|à|. Por lo que 


e Se espera que el método de Euler sea estable para 
у= Ау, y0)=0, endonde А < 0, 


sólo si el tamaño de paso h es menor а 2 /|А|. 


La situación es similar para otros métodos de un paso. En general, existe una función О 
con la propiedad de que el método de diferencia, cuando se aplica a la ecuación de prueba, da 


Wi = О(АА)у;. (5.66) 


La precisión del método depende de qué tan bien О (АА) aproxima e?”, у el error crecerá sin 
cota sil O(hA)| > 1. El método de Taylor de enésimo orden, por ejemplo, tendrá estabilidad 
respecto tanto al crecimiento del error de redondeo como al error absoluto, siempre y cuando 
se seleccione h para satisfacer 


1 2,2 1 пуп 
ТАРАР А ++ АА < 1. 
п. 


El ejercicio 10 examina el caso específico cuando el método es el clásico Runge-Kutta de 
cuarto orden, que es, fundamentalmente, el método de Taylor de cuarto orden. 

Cuando se aplica un método multipasos de la forma (5.54) a la ecuación de prueba, el 
resultado es 


W j+1 = Am-1Wj peo AOW j+1—m T hà (bmw рул T bm-1Wj Poek bow j+1—m), 
para j = т — 1,...,№ — 1,0 
a = hàbm)w ут Е (Am-1 + hàbm-1)wj A (ao + hàbo)W j+1-m =0. 


Relacionado con esta ecuación de diferencia homogénea se encuentra el polinomio 
característico 


Q(z, hà) = a = hàbm)z” == (4-1 F ААР)! HA (ao F hìbo). 


Este polinomio es similar al polinomio característico (5.58), pero también incorpora la ecua- 
ción de prueba. La teoría aquí iguala el análisis de estabilidad en la sección 5.10. 

Suponga que wọ, ... ,Wm-1 están determinados y, para hÀ, sean B,,... , m los ceros 
del polinomio Q(z, hà). Si B;,... , Bm son distintos, entonces existe C1,... , Cm соп 


m 


wj=X (b), paraj=0,...,N. (5.67) 
k=1 


5.11 Ecuaciones diferenciales rígidas 265 


Si Q(z, hà) tiene múltiples ceros, w; se define de manera similar. (Consulte la ecuación 
(5.63) en la sección 5.10.) Si у; aproxima con precisión y(tj) = е/”® = (el*)/, entonces 
todos los ceros В; deben satisfacer | By] < 1; de lo contrario, ciertas opciones de а resultarán 
en c + 0, y el término cz (Br)! no decaerá a cero. 


Ilustración La ecuación diferencial de prueba 
; 1 
у =—30у, 0<t<1.5, у(0) = 3 


tiene la solución exacta y = zem, Al utilizar h = 0.1 para el algoritmo 5.1 de Euler, el 
algoritmo 5.2 de Runge-Kutta de cuarto orden y el algoritmo 5.4 de Adams indicador- 


corrector da los resultados en ѓ = 1.5 en la tabla 5.23. ш 
Tabla 5.23 Solución exacta 9.54173 х 10-2 

Método de Euler —1.09225 x 10* 

Método Runge-Kutta 3.95730 x 10! 

Método indicador corrector 8.03840 x 10% 


Las imprecisiones en la ilustración se deben al hecho de que | О(Л))| > 1 para el méto- 
do de Euler y el método Runge-Kutta y que Q(z, hà) tiene ceros con módulos que exceden 
a uno para el método indicador-corrector. Para aplicar estos métodos a este problema, se 
debe reducir el tamaño de paso. La siguiente definición se usa para describir la cantidad de 
reducción de tamaño de paso requerida 


Definición 5.25 La región R de estabilidad absoluta para un método de un paso es R = { ЛА € С | | О(Л))| 
< 1), y para un método multipasos es R = { hà € С | |Bx| < 1, para todos los ceros В; de 


Q(z, ҺА) }. и 


Las ecuaciones (5.66) у (5.67) implican que se puede aplicar un método de manera 
efectiva a una ecuación rígida sólo 51 hÀ se encuentra en la región de estabilidad absoluta del 
método, lo cual, para un problema determinado, establece una restricción en el tamaño de h. 
Aunque el término exponencial en la solución exacta decae rápidamente a cero, АЛ debe 
permanecer dentro de la región de estabilidad absoluta a lo largo del intervalo de £ valores 
para que la aproximación tienda a cero y el crecimiento del error esté bajo control. Esto sig- 
nifica que, a pesar de que h se podría incrementar normalmente debido a las consideraciones 
del error de truncamiento, el criterio absoluto de estabilidad fuerza h a continuar siendo 
pequeño. Los métodos de tamaño de paso variable son especialmente vulnerables a este 
problema ya que una revisión del error de truncamiento local podría indicar que el tamaño 
de paso puede aumentar. Esto podría resultar inadvertidamente en Л). fuera de la región de 
estabilidad absoluta. 

En general, la región de estabilidad absoluta de un método es el factor crítico al producir 
aproximaciones precisas para sistemas rígidos, por lo que los métodos numéricos se buscan 
con una región de estabilidad absoluta tan grande como sea posible. Se dice que un método 
numérico es A-estable si su región R de estabilidad absoluta contiene todo el plano medio 
izquierdo. 


A porque El método trapezoidal implícito, determinado por 


involucra ууу ү en ambos lados 


de la ecuación. wọ = а, (5.68) 


h А 
юу у [Ры уы) fw], 0O<sj<N=1, 
es un método A-estable (consulte el ejercicio 14) y es el único método multipasos A-estable. 


A pesar de que el método trapezoidal no brinda aproximaciones precisas para los tamaños de 
paso grandes, su error no aumentará de manera exponencial. 
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Las técnicas que se usan con mayor frecuencia para los sistemas rígidos son métodos 
multipasos implícitos. En general, ур; у se obtiene al resolver una ecuación no lineal о un 
sistema no lineal de manera iterativa, a menudo con el método de Newton. Considere, por 
ejemplo, el método trapezoidal implícito 


h 
Уу: =} + 517+, м) + (у, )]. 
Al calcular £;, 1, y w j, necesitamos determinar уг, la solución para 
h 
EW) === zU Ew) + fE w) = 0. (5.69) 


а 2 В 0 
Рага aproximar esta solución, seleccione 2 ОЬ normalmente сото w j, Y genere w 


aplicar el método de Newton a la ecuación (5.69) 


(0) 


ін al 


„®© —„@%-›_ Fw) 
E) 


any Wa =Wp> Hew + Ра wa] 


LE fr (tawi) 


hasta que №09, = wé” sea suficientemente pequeña. Éste es el procedimiento que se 


aplica en el algoritmo 5.8. Normalmente, sólo se requieren tres o cuatro operaciones por paso 
debido a la convergencia cuadrática del método de Newton. 

El método de la secante se puede utilizar como una alternativa para el método de Newton 
en la ecuación (5.69) pero entonces, se requieren dos aproximaciones iniciales diferentes para 
w уут: Para usar el método de la secante, la práctica usual es hacer we; = wj y Obtener ws? 
a partir de algún método multipasos explícito. Cuando un sistema de ecuaciones rígidas par- 
ticipa, se requiere una generalización ya sea para el método de Newton o de la secante. Estos 


temas se consideran en el capítulo 10. 


Iteración trapezoidal con Newton 


Para aproximar la solución del problema de valor inicial 


у= Р(, у), paraa<t<b, con y(a)=0 
en (N + 1) números igualmente espaciados en el intervalo [ a, b]: 


ENTRADA extremos а, b; entero N; condición inicial о; tolerancia TOL; número máximo 
de iteraciones M en cualquier paso uno. 


SALIDA aproximación w para y en los valores (№ + 1) de го un mensaje de falla. 


Paso 1 Determine h = (b — а)/№; 
t=4; 
w = 0; 
SALIDA (t, у). 
Paso 2 Parai = 1, 2,..., N haga los pasos 3-7. 
Paso З Determine Ку = w + EfG, w); 
wo = ki; 
j=l; 
FLAG =0. 


Ilustración 


Tabla 5.24 
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Paso 4 Mientras FLAG = О haga los pasos 5-6. 


h 
wo — ¿FEF h, wo) — ki 
Paso 5 Determine w = wọ — ; 


h 
1- 3HE +h, wo) 


Paso 6 Silw — wol < TOL entonces determine FLAG = 1 
entonces determine j = j+ 1; 
wọ = w; 
si j > M entonces 
SALIDA (“El número máximo de 
iteraciones excedido’); 


PARE. 
Paso 7 Determine t = a + ih; 
SALIDA (t,w). Fin del paso 2 
Paso 8 PARE. п 
El problema de valor inicial rígido 
y =5 (y-t)? +1, 0<t<1, y(0)=-1 


tiene como solución y(t) = t — e7*, Para mostrar los efectos de rigidez, el método trape- 
zoidal implícito y el método Runge-Kutta de cuarto orden se aplican con N = 4, al hacer 
h = 0.25, y con N = 5, que da Л = 0.20. 

El método trapezoidal se desempeña correctamente en ambos casos, usando M = 10 y 
TOL = 107%, al igual que Runge-Kutta con h = 0.2. Sin embargo, h = 0.25 está fuera de 
la región de estabilidad absoluta del método Runge-Kutta, que es evidente a partir de los 
resultados en la tabla 5.24. н 


Método Runge-Kutta Método trapezoidal 


h=0.2 h=0.2 
ti wi lyt) — wil Wi lyt) — wil 
0.0 —1.0000000 0 —1.0000000 0 
0.2 —0.1488521 1.9027 x 10? —0.1414969 2.6383 x 107? 
0.4 0.2684884 3.8237 х 107° 0.2748614 1.0197 х 1072 
0.6 0.5519927 1.7798 х 107° 0.5539828 3.7700 х 10? 
0.8 0.7822857 6.0131 х 107* 0.7830720 1.3876 х 107° 
1.0 0.9934905 2.2845 х 1074 0.9937726 5.1050 х 1074 
h = 0.25 h = 0.25 
ti Wi lyti) = wil Wi lyti) = wil 
0.0 —1.0000000 0 —1.0000000 0 
0.25 0.4014315 4.37936 x 107! 0.0054557 4.1961 x 10? 
0.5 3.4374753 3.01956 х 10° 0.4267572 8.8422 х 105° 
0.75 1.44639 х 10% 1.44639 х 10% 0.7291528 2.6706 х 107 
1.0 Desbordado 0.9940199 7.5790 x 107* 


Aquí hemos presentado sólo una breve introducción para lo que el lector, que con fre- 
cuencia encuentra ecuaciones diferenciales rígidas, debería saber. Para mayores detalles con- 
sulte [Ge2], [Lam] o [SGe]. 


La sección Conjunto de ejercicios 5.11 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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WEN 5.12 Software numérico 


La biblioteca IMSL incluye dos subrutinas para aproximar las soluciones de los problemas 
de valor inicial. Cada uno de los métodos resuelve un sistema de m ecuaciones de primer 
orden en m variables. Las ecuaciones son de la forma 


dui 
dt 


= fi(t, u1, U2,... , Um), parai=1,2,...,m, 


donde u; (%) se da para cada i. Una subrutina de tamaño de paso variable está basada en los 
métodos Runge-Kutta de cuarto y quinto orden descritos en el ejercicio 7 de la sección 5.5. 
Una subrutina de tipo Adams también está disponible para utilizarse para ecuaciones rígidas 
con base en un método de C. William Gear. Este método utiliza métodos multipasos implíci- 
tos de orden hasta 12 y fórmulas de diferenciación regresiva de orden hasta 5. 

Los procedimientos tipo Runge-Kutta contenidos en la biblioteca NAG están basados en 
la forma Merson del método Runge-Kutta. Un método Adams de una variable y de tamaño 
de paso variable para sistemas rígidos. Otras rutinas incluyen los mismos métodos, pero se 
iteran hasta que un componente de la solución logra un valor determinado o hasta que una 
función de la solución es cero. 

La biblioteca netlib incluye varias subrutinas para aproximar las soluciones de los 
problemas de valor inicial en el paquete EDO. Una subrutina está basada en los métodos 
Runge-Kutta- Verner de quinto y sexto orden, otra en los métodos Runge-Kutta-Fehlberg de 
cuarto y quinto orden, como se describe en la página 220 de la sección 5.5. Una subrutina 
para problemas de valor inicial de ecuación diferencial ordinaria rígida está basada en una 
fórmula de diferenciación regresiva de coeficiente variable. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Metodos directos para resolver 
sistemas lineales 


Introducción 


Las leyes de Kirchhoff de circuitos eléctricos establecen que tanto el flujo de corriente de la 
red hacia cada unión como la caída de voltaje alrededor de cada ciclo cerrado de un circuito 
son cero. Suponga que se aplica un potencial de V volts entre los puntos A y G en el circuito y 
que i4, i2, i3, ід y іѕ representan el flujo de corriente como se muestra en el diagrama. Usando 
G como punto de referencia, las leyes de Kirchhoff implican que las corrientes satisfacen el 
siguiente sistema de ecuaciones lineales: 


51 + 51 = V, 
із — 14—15 = 0, 
2i4 — 315 = 0, 


ii = i2 — із = 0, 
50 — Ti; = 204 = 0. 


А 20 В 30 C 


En este capítulo se considerará la solución de sistemas de este tipo. Esta aplicación se 
analiza en el ejercicio 23 de la sección 6.6. 

Los sistemas de ecuaciones lineales están relacionados con muchos problemas en 
ingeniería y ciencia, así como con aplicaciones de matemáticas para las ciencias sociales y 
el estudio cuantitativo de problemas de negocios y economía. 

En este capítulo, consideramos métodos directos para resolver un sistema de n ecuacio- 
nes lineales en n variables. Este sistema tiene la forma 


Ет: duxi +арх +++ + ахь = bi, 


Е: Фіх +422X2 +++ + anXn = bz, 
(6.1) 


En: алх + aX + ах, = bn. 


En este sistema nos proporcionan las constantes а; j, para cada i, ј = 1, 2,... ,n, у bi, para 
cada і = 1, 2,... ‚п y necesitamos determinar las incógnitas x1, ... , Xn- 
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Las técnicas directas son métodos que proporcionan teóricamente la solución exacta 
del sistema en un número finito de pasos. En la práctica, por supuesto, la solución obtenida 
estará contaminada por el error de redondeo relacionado con la aritmética utilizada. Analizar 
el efecto de este error de redondeo y determinar formas para mantenerlo bajo control será un 
componente muy importante de este capítulo. 

No se supone que un curso de álgebra lineal sea un prerrequisito para este capítulo, por 
lo que incluiremos una serie de nociones básicas sobre el tema. Estos resultados también se 
utilizarán en el capítulo 7, donde consideraremos los métodos para aproximar la solución de 
los sistemas lineales con métodos iterativos. 


. 6.1 Sistemas de ecuaciones lineales 


Utilizamos tres operaciones para simplificar el sistema lineal dado en la ecuación (6.1): 


1. La ecuación E, puede multiplicarse por cualquier constante А diferente de cero y 
la ecuación resultante puede usarse en lugar de E,. Esta operación se denota como 
QE¡) > (Ei). 

2. La ecuación E; puede multiplicarse por cualquier constante А diferente de cero y 
sumarse con la ecuación E, y la ecuación resultante puede usarse en lugar de E;. Esta 
operación se denota como (E; +4E;¡) > (E). 

3. El orden de las ecuaciones ЕЁ; y Ej puede intercambiarse. Esta operación se denota 
(Е) > (E). 


Mediante una secuencia de estas operaciones, un sistema lineal se transformará de manera 
constante en uno nuevo más fácil de resolver y con las mismas soluciones (consulte el ejer- 
cicio 13). La secuencia de las operaciones se ilustra a continuación. 


Ilustración Las cuatro ecuaciones 


E: + Xx, +3x4= 4, 
Es: 25+ Xx x3+x4= 1, 
Ez: Зху— Xx2— x3+2x4=-3, 
Er: —x1+2x2+3x3— х= 4, 


(6.2) 


se resolverán рага x1, X2, хз у x4. Primero usaremos la ecuación E; para eliminar el valor descono- 
cido ху de las ecuaciones E», Ез y Ex) al realizar (Ez — 2E1) > (Е), (Ез — 3E1) > (Ез), y 
(E4 + E1) > (E3). Por ejemplo, en la segunda ecuación 


(E2 — 2Е\) > (E2) 
produce 
(2x1 + x2 = хз + x4) — 2(x1 + x2 + 3x4) = 1— 2(4), 


que se simplifica para el resultado mostrado como ЕЁ» en 


Ei: x+ 2 +3x4= 4, 
E): = = А3 = 54 = —7, 
Ез: 4х2 хз — 7х4 = — 15, 
Ед: 3x2 + 3x3 + 2x4 = 8. 


Рог simplicidad, las ecuaciones nuevas se etiquetan otra vez сото E, E2, Ez y E4. 


Definición 6.1 


Ejemplo 1 
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En el nuevo sistema, E, se usa para eliminar la incógnita x de Ез y E4 al realizar 
(Ез — 4E2) > (Ез) y (E4 + 3E2) — (Ед). Esto resulta en 


Er: xtX + 3x4= 4, 
E): = Хә = Хз = 504 = —7, 
Ез: 3x3 + 13х4 = 13, (6.3) 
Ел: — 13x4 = —13. 


Ahora, el sistema de ecuaciones (6.3) tiene una forma triangular (o reducida) y se puede 
resolver para las incógnitas mediante un proceso de sustitución hacia atrás. Ya que E4 im- 
plica x4 = 1, podemos resolver Ёз para хз para obtener 


1 1 
Хз = 3013 — 13x4) = as = 13) = 0. 


Al continuar, Е nos da 
x2 = —(—7 + 5x4 + x3) = —(—7 + 5 +0) = 2, 
y Е da 
xı = 4— 3x4 — Xx: = 4—3 — 2 = –1. 


La solución para el sistema (6.3) y, por consiguiente, para el sistema (6.2) es, por lo tanto 
Х\ 1, x2 = 2, x3 =0,yx4= 1. ш 


Matrices y vectores 


Al realizar los cálculos en la ilustración, no es necesario escribir las ecuaciones completas 
en cada paso o retener las variables x1, x2, x3, y x4 a lo largo de los cálculos, si siempre per- 
manecen en la misma columna. La única variación de sistema a sistema se presenta en los 
coeficientes de las incógnitas y en los valores del lado derecho de las ecuaciones. Debido a 
esto, a menudo, se reemplaza un sistema lineal con una matriz que contiene toda la informa- 
ción sobre el sistema necesaria para determinar su solución, pero de manera compacta y una 
que se representa fácilmente en una computadora. 


Una matriz n X m (n por m) es un arreglo rectangular de elementos con n filas y m co- 
lumnas en las que no sólo se encuentra el valor de un elemento importante, sino también su 
posición en el arreglo. a 


La notación para una matriz n X m será una mayúscula, como A, para la matriz y mi- 
núsculas con subíndices dobles, сото a; у, para referirse a la entrada en la intersección de la 
i-ésima fila y la j-ésima columna; es decir 


а 412 Aim 

ау an2 @2т 
A = [а] = 

Ant An "~ Anm 


Determine el tamaño y las entradas respectivas de la matriz. 


2 —1 7 
= л 


Solución La matriz tiene dos filas y tres columnas, por lo que su tamaño es 2 X 3. Sus en- 
tradas se describen con аџ = 2,412 = —1, a13 = 7, 01 =3,4272 = 1, y аз = 0. ш 
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Aumentada se refiere al hecho de 
que el lado derecho del sistema 
se ha incluido en la matriz. 


La matriz 1 = n 
А = [ар aj +++ а] 


recibe el nombre de vector а n-dimensional у una matriz n х 1 


An 


recibe el nombre de vector columna n-dimensional. Normalmente, para los vectores se 
omiten los subíndices y se utilizan letras minúsculas negritas para denotarlos. Por lo tanto, 


Ed 


denota un vector de columna y 


у= [yı у... yl 


un vector de fila. Además, a menudo, los vectores fila tienen comas entre las entra- 
das para hacer que la separación sea clara. Por lo que usted podría ver y escrita como 


y= [у1, Vds .... Уп]. 
Una matriz n X (п + 1) se puede usar para representar el sistema lineal 


A11X1 + 12X2 + +++ + ainXn = bı, 


a21 X1 + a22X2 + `+ © + алх = ba, 


ахі + an2X2 + + ахь = bn, 


al construir primero 


а ај сс Ain by 
an an -=* An b2 
А = [а:;] = І . . у b= 

аһ] an2 77" Ann bn 
ап ар ° An : b 
da an с an : b 

[A, b] = А 

ап] аһ2 ++ Ann : bn 


donde la línea punteada vertical se usa para separar los valores de los coeficientes de las 
incógnitas con los del lado derecho de las ecuaciones. El arreglo [A, b] recibe el nombre de 
matriz aumentada. 

La repetición de las operaciones implicadas en la ilustración de la página 270 con la 
notación resulta en considerar primero la matriz aumentada: 


| 1 1 0 3 | 

2 1 1% 1 
3 -1 -1 2 1—3 | 
=l 2 3 -1 A 


Una técnica similar a la 
eliminación gaussiana apareció 
por primera vez durante la 
dinastía Han en China, en el texto 
Chapters on the Mathematical 
Art (Capítulos sobre el arte 
matemático), escrito alrededor 
del año 200 a.C. Joseph 

Louis Lagrange (1736-1813) 
describió una técnica similar 

a este procedimiento en 1778 
para el caso en que el valor 

de cada ecuación sea 0. Gauss 
proporcionó una descripción 

más general en Theoria Motus 
corporum coelestium sectionibus 
solem ambientium, que describía 
la técnica de mínimos cuadrados 
que usó en 1801 para determinar 
la órbita del planeta menor Ceres. 
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Realizar las operaciones de acuerdo con lo descrito en el ejemplo produce matrices aumen- 
tadas 


1 1 0 3 4 1 то 3: 4 
0 -1 -1 —5 7 0 —1 —1 5: —7 
е =i 7 15 Y |0 o 3 182 013 
0 3 3 2 8 0 0 0 -13 :-13 


Ahora, la matriz final se puede transformar en su sistema lineal correspondiente y es 
posible obtener soluciones para x1, x2, x3 y x4. Este procedimiento recibe el nombre de 
eliminación gaussiana con sustitución hacia atrás. 

El procedimiento general de eliminación gaussiana aplicado al sistema lineal 


Ei: a11Xx1+412X2 +++: + ainXn = bi, 
E: Фіх + 42X2 +: + anXn = b2, 
(6.4) 
En: апхі + an2X2 +: + ахь = bn, 
se maneja de manera similar. Primero, forme la matriz aumentada A, 
ај dp ain al n+l 
2 а an An @2,п+1 
А =[A,b] = Р (6.5) 
аһ n2 dnn An,n+1 


donde A denota la matriz formada por los coeficientes. Las entradas en la (n + 1) columna 
son los valores de b; es decir, a; „+1 = b; para cada i = 1,2,..., п. 
Siempre y cuando ау # O, realizamos las operaciones correspondientes para 


(E; — (ajı/an)Eı) > (Ej) para cada ¡ =2,3,...,n 


para eliminar el coeficiente de x, en cada una de estas filas. A pesar de que se espera que cam- 
bien las entradas en las filas 2, 3, ... , n, para facilidad de notación, nuevamente denotamos la 
entrada en la ¡-ésima fila y la j-ésima columna mediante a;;. Con esto en mente, seguimos el 
procedimiento secuencial рага  =2,3,...,n— 1 y realizamos la operación 


(Е; = (a¡¡/aj Es) > (E;) para cada j = i + 1,i +2,...,7, 


siempre y cuando а; + 0. Esto elimina (cambia el coeficiente a cero) х; en cada fila debajo 
del ¡-ésimo para todos los valores dei = 1, 2,... ‚п — 1. La matriz resultante tiene la forma 


а ар din а1,п+1 

А 0. ‚а An a2,n+1 

A к: кыл a 
ПОЕТ 0 Ann An,n+1 


donde, excepto en la primera columna, no se espera que los valores de а;; concuerden con 


los de la matriz original Á. La matriz Á representa un sistema lineal con la misma solución 
establecida como el sistema original. 
El sistema lineal nuevo es triangular, 


411X1 + 120 +: + ах 


а22Х2 +++ + anXn 


AnnXn 


й\,п+1› 


@2,п+1› 


dn,n+1> 


Ejemplo 2 


El elemento pivote para una 
columna específica es la entrada 
utilizada para colocar ceros 

en las otras entradas en esa 
columna. 
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Represente el sistema lineal 


Ei: хү— Xx2+2x3-— x4= —8, 
E: 2x1 — 2x2 + 3x3 — 3x4 = —20, 
Es: xt 0+ Хз = =2, 


Еа Xx; — х + 4х3 + 3x4 = 4, 
сото una matriz aumentada y utilice la eliminación gaussiana para encontrar su solución. 


Solución La matriz aumentada es 


1 1 2 1 8 

So a 2 2 3 3 20 
— АЧ — 

A 1 1 1 0 —2 

1 —1 4 3 4 


Al realizar las operaciones 


(E2 — 2E1) > (Ез), (Ез E1) > (Ез), у (E4- Е) > (Еа), 


obtenemos 
1 —1 2 -1 : —8 
~ (0) 0 -1 -1 : —4 
(4) _ . 
= 0 2 —1 1. : 6 
0 0 2 4 : 12 


La entrada diagonal аб), conocida como elemento pivote, es 0, рог lo que el ргосе- 
dimiento no puede continuar en su forma actual. Sin embargo se permiten las operaciones 
(Ei) <> (Е;), por lo que se realiza una búsqueda de elementos ао y д) рага el primer 
elemento diferente de cero. Puesto que DA Æ 0, se realiza la operación (E2) <> (E3) para 


obtener una matriz nueva 


1 -1 2 —1 ъв 

ai 0 2 -1 1: 6 
(2) _ . 

dl E E E сй 

0 0 2 47 12 


Puesto que хә ya se ha eliminado de Ez y Аб) será АО), у los cálculos continúan con Іа оре- 
ración (E4 + 2E3) > (Ед), lo que nos da 


1 —1 2 —1 :—8 

~ 0 2 —1 1: 6 
© : 

аз 0 0 -1 —1 : —4 

0 0 0 2. 4 


Finalmente, la matriz se vuelve a convertir en un sistema lineal que tiene una solución equi- 
valente a la solución del sistema original y se aplica la sustitución hacia atrás: 


4 
X4 = > = 2x 
Маал 
16-1 0а + x4]] _ 
х = > =3, 
[—8 — [(=1)x2 + 2x3 + (—1)x4]] 
Xx] = = —7. 


1 ш 
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El ejemplo 2 ilustra lo que se hace si а = = 0 рага algunas К = 1, 2,...,п — 1. Рага 
la k-ésima columna de а pe la k-ésima fila hasta la enésima fila se buses la primera 
entrada diferente a cero. Si а k 22 0 para algunas p,conk + 1 < p < n, entonces se realiza 
la operación (E) <> (Ep) para obtener Аб) El procedimiento puede continuar para for- 
mar А“ y así sucesivamente. Si ae = = 0 para cada p, se puede mostrar (consulte el teorema 
6.17 en la página 298) que el sistema lineal no tiene una solución única y el procedimiento 
se detiene. Finalmente, si 20") = 0, el sistema lineal no tiene una solución única y, de nuevo, 
el procedimiento se detiene. 

El algoritmo 6.1 resume la eliminación каен con sustitución hacia atrás. El algorit- 
mo incorpora el pivote cuando uno de los pivotes а ) es 0 al intercambiar H ‚ш fila con 
la p-ésima fila, donde p es el entero más pequeño ена a k para el que al e + 0. 


Eliminación даиѕѕіапа con sustitución hacia atrás 
Para resolver el sistema lineal n X n 


Ei: auxi +арх + +++ + dinXn = апі 
E: d21X1 + ахо + + @2пХа = @2,п+1 


En 2 апхі + ао + -+ + AnnXn = An,n+1 


ENTRADA número de incógnitas y ecuaciones n; matriz aumentada А = [a;;], donde 
lsis<nyl<j<n+l. 


SALIDA Рага х), x2,... , х, O mensaje de que el sistema lineal no tiene solución 
única. 
Paso 1 Рага i=1,...,n— 1 haga los pasos 2—4. (Proceso de eliminación.) 


Paso 2 Si p es el entero más pequeño con і < p < ny api #0. 
si no es posible encontrar un entero p 
entonces SALIDA (‘no existe una solución única’); 
PARE. 


Paso 3 Sip % i entonces realice (Ep) > (E;). 
Paso 4 Paraj=i+1,... ‚п haga los pasos 5 уб. 
Paso 5 Determine mji = а: /ан. 
Paso 6 Ejecute (E; — mji Ei) > (Ej); 


Paso 7 Si a,n = 0 entonces SALIDA (‘no existe una solución única”); 


PARE. 
Paso 8 Determine х, = an,n+1/4nn. (Inicia sustitución hacia atrás.) 
Paso 9 Parai =n — 1,... , 1 determine x; = [dns — A] Jus 
Paso 10 SALIDA (x¡,... , Xn); (Procedimiento completado con éxito.) 


PARE. ы 


Ilustración 


6.1 Sistemas de ecuaciones lineales 277 


El objetivo de esta ilustración es mostrar lo que pasa si el algoritmo 6.1 falla. Los cálculos se 
realizarán de manera simultánea en dos sistemas lineales 


xit 0+ х3 = 4, Хх + 0+ х3 = 4, 
2х1 +2x2+ х3 = 6, y 2x1 + 20 + x3=4, 
Xx + х + 253 = 6, х + х + 253 = 6. 
Estos sistemas producen las matrices aumentadas 
1 1 1 4 111 4 
А= |22 1:6 y А= [22 1:4 
1.1 2 6 1 1 2 6 


Puesto que аџ = 1, realizamos (E) — 2E1) > (E2) y (Ез — Е) > (Ез) para producir 


1 1 4 1 1 4 
А=|0 0 -1 : -2 y А=10 0 -1 :-4 
о 0 : 2 о 0 : 2 


En este punto, an = азо = 0. El algoritmo requiere que el procedimiento se detenga y по 
se obtiene ninguna solución para el sistema. Al escribir las ecuaciones para cada sistema 
obtenemos 


xita + x= 4, xtut x= 4, 
—X3 = —2, у —Хз = —4, 
хз = 2, X3 = 2. 


El primer sistema lineal tiene un número infinito de soluciones, que se pueden describir me- 
diante хз = 2, x2 = 2 — x1, y xı de manera arbitraria. 

El segundo sistema conduce a la contradicción x3 = 2 y x3 = 4, por lo que no existe 
solución. Sin embargo, en este caso, no hay solución única, como concluimos a partir del 
algoritmo 6.1. E 


A pesar de que el algoritmo 6.1 puede ser observado como las construcciones de las 
matrices aumentadas А0), ... , A, los cálculos pueden realizarse con sólo un arreglo 
nx (п+1). En cada paso, simplemente reemplazamos el valor anterior de а;; рог el nuevo. 
Además, podemos almacenar multiplicadores de ту en las ubicaciones de ау porque aj; tiene 
el valor 0 para cada i =1,2,...,n—=1lyj=1i+1,+2,... , n.Porlo tanto, A se puede 
sobreescribir mediante los multiplicadores en las entradas debajo de la diagonal principal (es 
decir, las entradas de la forma ау, con j > i) y mediante las entradas recientemente calcu- 
ladas de А“? еп y sobre la diagonal principal (las entradas de la forma а; ¡con j < i). Estos 
valores se pueden obtener para resolver otros sistemas lineales relacionados con la matriz 
original А, como observaremos en la sección 6.5. 


Conteo de operaciones 


Tanto el tiempo requerido para completar los cálculos como el error de redondeo subse- 
cuente dependen del número de operaciones aritméticas de punto flotante necesarias para 
resolver un problema de rutina. En general, la cantidad de tiempo requerido para realizar 
una multiplicación o división en una computadora es aproximadamente el mismo y es muy 
superior al requerido para realizar una suma o una resta. Las diferencias reales en el tiempo 
de ejecución, sin embargo, dependen del sistema computacional particular. Para demostrar 
las operaciones de conteo para un método determinado, contaremos las operaciones reque- 
ridas para resolver un sistema lineal común de n ecuaciones con n incógnitas-mediante el 
algoritmo 6.1. Mantendremos el conteo de las sumas/restas separado del conteo de las mul- 
tiplicaciones/divisiones debido al diferencial de tiempo. 
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No se realizan operaciones aritméticas hasta los pasos 5 y 6 en el algoritmo. El paso 5 
requiere realizar (n — i) divisiones. El reemplazo de la ecuación E; mediante (Е; — m¡E;) 
en el paso 6 requiere multiplicar ту por cada término en E;, lo cual resulta en un total de 
(n—i)(n—i+ 1) multiplicaciones. Después de completar esto, cada término de la ecuación 
resultante se resta del término correspondiente en E;. Esto requiere (n — ¿)(n — i + 1) restas. 
Paracadai = 1, 2,... ‚п — 1, las operaciones requeridas en los pasos 5 y 6 son los siguientes. 


Multiplicaciones/divisiones: 
M—-i)+(M-iM-=i+1)=(n—iMn—i+2). 
Sumas/restas: 


(n—i)\(n—i+1). 


El número total de operaciones requeridas por los pasos 5 y 6 se obtiene al sumar el 


conteo de operaciones para cada i. Al recordar, a partir del cálculo que 


m m 


> 1=т, Ni), у = _ аа 


j=! 


tenemos el siguiente conteo de operaciones. 


Multiplicaciones/divisiones: 


п—1 п—1 


Уш - (0 -1+2) = У (и? —2ni +i? +2n – 2i) 


і=1 i=1 


n—1 n—1 n—1 


Dn 0-05 +2 


¡=1 ¡=1 
(п — 1)п(2п — 1) Е а Dn 2n? + 3n? — 5n 
Е 6 >= 6 | 


Sumas/restas: 


n—1 n—1 


Уш -@—ї+1)= у (1 -2ni +12 +n – й) 


isl і=1 


п—1 п—1 n—1 


=> a-i’ ¿Po Led 


i=1 i=1 і=1 


_ (п = 1)п0п = 1) (M-Dn п-п 


6 2 3 


Los únicos otros pasos en el algoritmo 6.1 que implican operaciones aritméticas son los 
requeridos para la sustitución hacia atrás, los pasos 8 y 9 requieren una división. El paso 9 
requiere (n — i) multiplicaciones y (n — i — 1) sumas para cada término de suma y, después, 
una resta y una división. El número total de operaciones en los pasos 8 y 9 es la siguiente. 
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Multiplicaciones/divisiones: 


п—1 


п—1 
eo ro=1+ (Lo) +11 
i=1 


i=l 


n—1 n—1 п Еп 
=п+ Y (n-1)=n+ Уі = a" 
i=1 і=1 


Sumas/restas: 


п—1 п—1 


п—1 2 _ 
NA-i-D+0=Na-)=)YN)i= == 


1=1 i=1 ¿=1 


El número total de operaciones aritméticas en el algoritmo 6.1 es, por lo tanto: 


Multiplicaciones/divisiones: 


2n? +3n?— 5n n+n n? 2 п 


6 2 3 3 
Sumas/restas: 
O al а 5n 
3 970. %& 


Рага п grande, el número total de multiplicaciones y divisiones es aproximadamente 
п? /3, ya que es el número total de sumas y restas. Por lo tanto, la cantidad de cálculos y el 
tiempo requerido aumenta con п en proporción a п?, como se muestra en la tabla 6.1. 


Tabla 6.1 


n Multiplicaciones/divisiones Sumas/restas 
3 17 11 
10 430 375 
50 44150 42875 
100 343300 338250 


La sección Conjunto de ejercicios 6.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WI | 6.2 Estrategias de pivoteo 


Al derivar el algoritmo 6.1,encontramos que se necesitaba un intercambio de filas cuando uno 
de los elementos pivote a® es cero. Este intercambio de filas tiene la forma (Ez) < (Ep), 
donde p es el entero más pequeño superior a kcon a A 0. Para reducir el error de redondeo, 
a menudo, es necesario realizar intercambios de filas incluso cuando los elementos pivote 
no son cero. 

Si a es de magnitud pequeña, en comparación con a 


multiplicador 


(0 


jk» Entonces la magnitud del 
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Ejemplo 1 


será mucho más grande que 1. El error de redondeo introducido en el cálculo de uno de los 
ИЕ k qe в k+1 аа 
términos а se multiplica mediante ту al calcular a А que compone el error original. 


Además, al realizar la sustitución hacia atrás para 


(k) п (k) 
ak n+l T Уры akj 
(k) , 
ар 


Xk = 


~ k . . к а 

соп un valor pequeño de а \ A , cualquier error en el numerador puede incrementar drástica- 
А Ее k А z : 

mente debido a la división de a Ы o. En nuestro ejemplo observaremos que incluso para siste- 


mas pequeños, el error de redondeo puede dominar los cálculos. 


Aplique la eliminación gaussiana para el sistema 


Еу: 0.003000х + 59.14x2 = 59.17 

E): 5.291x¡ — 6.130x, = 46.78, 
por medio de aritmética de cuatro dígitos con redondeo y compare los resultados con la so- 
lución exacta xı = 10.00 y x2 = 1.000. 
Solución El primer elemento pivote ат = 0.003000, es pequeño y está relacionado con el 
multiplicador, 


5.291 


= ————— = 1763.66, 
0.003000 


m21 


se redondea al número más grande 1764. Al realizar (Ез — m21 Е) > (E2) y el redondeo 
adecuado da el sistema 


0.003000х; + 59.14x2 ~ 59.17 
—104300x, ғ —104400, 


en lugar del sistema exacto, que es 


0.003000х; + 59.14x, = 59.17 
—104309.376x, = —104309.376. 


La disparidad en las magnitudes de m>,413 y аз ha introducido error de redondeo, pero el 
error de redondeo aún no se ha propagado. La sustitución hacia atrás produce 


x2 = 1.001, 


que es una aproximación cercana al valor real х = 1.000. Sin embargo, debido al pivote 
pequeño aıı = 0.003000, 
59.17 — (59.14)(1.001) _ 


PEN = —10.00 
0.003000 


contiene el error pequeño de 0.001 multiplicado por 


59.14 


————— 7 20000. 
0.003000 i 


Esto arruina la aproximación del valor real ху = 10.00. 

Esto es claramente un ejemplo artificial y la gráfica en la figura 6.1 muestra la razón por 
la que el error se puede presentar fácilmente. Para sistemas más grandes es mucho más difícil 
predecir cuándo se presentará un error de redondeo devastador. ш 


Figura 6.1 


Ejemplo 2 
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Aproximación 
(— 10, 1.001) 


Pivoteo parcial 


El ejemplo 1 muestra la forma en la que pueden surgir dificultades cuando el elemento pivo- 
te de es pequeño relativo a las entradas an parak <i <nyk < j < п. Para evitar este 


ij > 
roblema se realiza pivoteo al seleccionar un elemento а con una magnitud más grande 
pq 


como el pivote y al intercambiar las k-ésima y p-ésima filas. Esto puede ir seguido de un 
intercambio de la k-ésima y q-ésima columnas, en caso necesario. 

La estrategia más simple, llamada pivoteo parcial, es seleccionar un elemento en la 
misma columna que está debajo de la diagonal y que tiene el máximo valor absoluto; espe- 
cíficamente, determinamos la p > k más pequeña de tal forma que 


y realizamos (Ez) <> (Ep). En este caso, no se usa intercambio de columnas. 
Aplique la eliminación gaussiana para el sistema 


Еу: 0.003000x¡ + 59.14х› = 59.17 
E): 5.2915 — 6.130х› = 46.78, 


con pivoteo parcial y aritmética de cuatro dígitos con redondeo y compare los resultados con 
la solución exacta xı = 10.00 y x2 = 1.000. 


Solución El procedimiento pivotal parcial requiere encontrar primero 


máx ар, а) = máx {|0.003000], |5.291|) = [5.291 = |а). 


Esto requiere realizar la operación (Ез) > (E) рага producir el sistema equivalente 


Е\: 5.291x1 — 6.130x, = 46.78, 
Ез: 0.003000x, + 59.14х» = 59.17. 


El multiplicador para este sistema es 


ad 
= 21 =0.0005670 
mı 0) : > 
11 
y la operación (Ез — m21 Ё) > (Е) reduce el sistema а 


5.291x1 — 6.130x, = 46.78, 
59.14x, ~ 59.14. 


La respuesta de cuatro dígitos resultante a partir de la sustitución hacia atrás son los 
valores correctos de ху = 10.00 y x2 = 1.000. ш 
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La técnica recientemente descrita recibe el nombre de pivoteo parcial (o pivoteo de 
columna máxima) y se describe con detalle en el algoritmo 6.2. El intercambio de fila real se 
simula en el algoritmo al intercambiar los valores de NROW en el paso 5. 


Eliminación gaussiana con pivoteo parcial 
Para resolver el sistema lineal n X n 


Ei: ах +арх + +++ + ainXn = апі 
E: аруХу + d22X2 +: + anXn = а2 пі 


En 2 апхі + ао +: F AnnXn = An,n+1 


ENTRADA número de incógnitas y ecuaciones п; matriz aumentada А = [a;j] donde 
lsis<snyl<j<n+l. 


SALIDA solución x;,... , х, о mensaje de que el sistema lineal no tiene solución única. 
Paso 1 Para i = 1,... ‚п determine NROW(i) = і.  (Inicialice indicador de fila.) 
Paso 2 Para i = 1,... ‚п — 1 haga los pasos 3-6. (Proceso de eliminación.) 


Paso З Sea p el entero más pequeño con i < p < пу 
Ja (NROW(p), i)| = тах, < ¡<n la(NROW(J), i)|. 
(Votación: a(NROW (1), j) = ANROW;,j-) 


Paso 4 Si a(NROW(p), і) = 0 entonces SALIDA (‘no existe solución única”); 
PARE. 


Paso 5 Si NROW(i) + NROW(p) entonces determine NCOPY = NROW (i); 
NROW(i) = NROW( p); 
NROW(p) = NCOPY. 
(Intercambio de fila simulado.) 


Paso 6 Paraj=i+1,... ‚п haga los pasos 7 y 8. 
Paso 7 Determine m(NROW( j), i) = a(NROW( j), i)/a(NROW(i), i). 


Paso 8 Realice (Enrow(p) = m(NROW( j), 1) - Enrowa)) — (Enrow¿y) - 
Paso 9 Sia(NROW(n), n) = О entonces SALIDA (‘no existe solución única”); 
PARE. 
Paso 10 Determine х, = a(VNROW(n), п + 1)/a(NROW(n), n). 
(Inicie sustitución hacia atrás.) 
Paso 11 Parai=n-=1l,...,1 
a(NROW(),n+1)= Ужа a(NROW(i), ј) - х; 
а(мкоу (1), i) ` 


Paso 12 SALIDA (ху,...,х„); (Procedimiento completado con éxito .) 
PARE. ш 


determine х; = 


Cada multiplicador ту en el algoritmo de pivoteo parcial tiene una magnitud menor о 
igual que 1. A pesar de que esta estrategia es suficiente para muchos sistemas lineales, surgen 
situaciones en las que es inadecuada. 


Ilustración 
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El sistema lineal 


Еу: 30.00х; + 591400x2 = 591700, 
Е: 5.291х| — 6.130x2 = 46.78, 


es igual al de los ejemplos 1 y 2, excepto que todas las entradas en la primera ecuación se 
han multiplicado por 10*. El procedimiento de pivoteo parcial descrito en el algoritmo 6.2 
con aritmética de cuatro dígitos conduce a los mismos resultados obtenidos en el ejemplo 1. 
El valor máximo en la primera columna es 30.00 y el multiplicador 


5.291 


= —— = 0.1764 
30.00 


ma 


conduce al sistema 


30.00x, + 591400х› ~ 591700, 
—104300x, ғ —104400, 


que tiene las mismas soluciones inadecuadas que el ejemplo 1: хо ғ 1.001 y xı = —10.00. 
ш 


Pivoteo parcial escalado 


El pivoteo parcial escalado (o pivoteo de columna escalado) es el adecuado para el sistema 
en la ilustración. Éste coloca al elemento en la posición pivote que es la más grande en rela- 
ción con las entradas en su fila. El primer paso en este procedimiento es definir un factor de 
escala s, para cada fila como 


Si tenemos s; = 0 para algunas i, entonces el sistema no tiene solución única ya que todas 
las entradas en la ¡-ésima fila son O. Al suponer que éste no es el caso el intercambio de fila 
adecuado para colocar los ceros en la primera columna se determina al seleccionar el último 
entero p con 


la pr | „ lakı] 
—— = max — 
Sp l<k<n Sk 


y realizar (Е) > (Ep). El efecto de escalamiento es garantizar que el elemento más grande 
en cada columna tenga una magnitud relativa de 1 antes de la comparación realizada para 
determinar si se realiza el intercambio de fila. 

De manera similar, antes de eliminar la variable x; mediante las operaciones 


E¿—mgE;, parak=i+l,...,n, 


seleccionamos el entero más pequeño p > ¡con 


la pr | „ |ам| 
Р = máx 
Sp Ї<К<п Sk 
y realizamos el intercambio de fila (Е;) > (Ep) sii # p. Los factores de escala S1,... , Sn 


se calculan una sola vez, al inicio del procedimiento. Ahora, dependen de la fila, por lo que 
también se deben intercambiar cuando se realizan los intercambios de fila. 
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Ilustración 


Ejemplo 3 


Al aplicar el pivoteo parcial escalado para la ilustración previa obtenemos 


sı = máx{|30.00], |591400|} = 591400 


s2 = máx{|5.291|, |—6.130|} = 6.130. 
Por consiguiente, 


laul _ 3000 з», 12211 2:291 0.8631 
s 591400 i a eBo р. 


y se realiza el intercambio (Е) < (Е). 
Al aplicar la eliminación gaussiana al nuevo sistema 


5.291x; — 6.130x2 = 46.78 
30.00x1 + 591400x2 = 591700 


produce los resultados correctos xı = 10.00 y x2 = 1.000. 


Algoritmo 6.3 implementa el pivoteo parcial escalado. 


Eliminación gaussiana con pivoteo parcial escalado. 


Los únicos pasos en este algoritmo que difieren de los del algoritmo 6.2 son: 


Paso 1 Parai = 1,... ‚п determine s; = тах; lQ;;l; 
si s; = 0 entonces SALIDA (‘no existe solución única’); 
PARE. 


también determine NROW(i) = i. 
Paso 2 Parai = 1,... ‚п — 1 haga los pasos 3-6. (Proceso de eliminación.) 
Paso З Sip es el entero más pequeño con i < p < пу 
[a(NROW(p), 1)| de la(NROW(J), ї)| 
s(VROW(p)) isjen  s(NROW(J)) 


Resuelva el sistema lineal con aritmética de redondeo de tres dígitos. 


2.11x, = 4.21x2+0.921x3 = 2.01, 
4.01х + 10.2x, — 1.12x3 = —3.09, 
1.09x1 + 0.987x2 + 0.832x3 4.21. 


II 


Solución Tenemos sı = 4.21, s2 = 10.2, y s3 = 1.09. Por lo que, 


[а111 2.11 jan) 4.01 |аз1| 1.09 
—— =—— =0.501, —— = — = 0.393, == = 
зт 421 s 102 У = 109 
La matriz aumentada А A se define mediante 
2.11 —4.21 921 : 2.01 
4.01 10.2 1.12 : 3.09 


1.09 987 .832 : 4.21 
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Puesto que [аз |/5з es el más grande, realizamos (Е) > (Ез) para obtener 


1.09 ‚987 832 3 421 
401 10.2 1.12 : —3.09 
2.11 -—4.21 921 : 2.01 


Calcule los multiplicadores 


a21 431 
тә = — =3.68; тз = — = 1.94. 
a11 а11 


Realice las primeras dos eliminaciones para producir 


1.09 .987 .832 : 4.21 
0 6.57 —4.18 : —18.6 
0 —6.12 —.689 : —6.16 
Puesto que 
6.57 6.12 
A A гну" 
52 10.2 53 4.21 


realizamos Ез <> Ез, lo cual nos da 


1.09 ‚987 832 : 4.21 
0 6.12 —.689 : —6.16 
0 6.57 —418 : —18.6 


El multiplicador m32 se calcula a través de 


y 007, 


a22 


y el siguiente paso de eliminación en la matriz 


1.09 .987 832 : 4.21 
0 6.12 —.689 : —6.16 
0 0 492 : —252 


Finalmente, la sustitución hacia atrás da la solución x, la cual, para tres dígitos decimales, es 
xı = —0.431, x2 = 0.430, y хз = 5.12. ш 


Los primeros cálculos adicionales requeridos рага pivoteo parcial escalado resultan de la 
determinación de los factores de escala; existen (n — 1) comparaciones para cada una de las 
n filas, para un total de 


п(п — 1) comparaciones. 


Para determinar el primer intercambio correcto, serealizan n divisiones, seguidas den — 1 
comparaciones. Por lo que, la primera determinación de intercambio añade 


n divisiones y (n — 1) comparaciones. 


Los factores de escalamiento se calculan solamente una vez, por lo que el segundo paso 
requiere 


(n — 1) divisiones y (n — 2) comparaciones. 
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Seguimos de manera similar hasta obtener ceros por debajo de la diagonal principal en 
todas las filas, excepto enésima. El paso final requiere realizar 


2 divisiones y 1 comparación. 
En consecuencia, el pivoteo parcial escalado añade un total de 


n—1 
—1 3 
п(п = 1) + Ук =n(n-—1)+ (n m = -n(n — 1) comparaciones (6.7) 


k=1 


n 


_ п(п + 1) 1 үү 
k= Ук 1= 1=-(n—1)(n+2) divisiones 
k=2 k=1 2 2 
al procedimiento de eliminación gaussiana. El tiempo requerido para realizar una compara- 
ción es aproximadamente el mismo que el de una suma/resta. Puesto que el tiempo total para 
realizar el procedimiento básico de eliminación gaussiana es O (п? /3) multiplicaciones/divi- 
siones y O (n? /3) sumas/restas, el pivoteo parcial escalado no añade tiempo computacional 
significativo requerido para resolver un sistema para valores grandes de л. 

Para enfatizar la importancia de seleccionar una sola vez los factores de escala, conside- 
re la cantidad de cálculos adicionales que se requerirían si se modificara el procedimiento de 
tal forma que se determinaran factores de escala nuevos cada vez que se realice una decisión 
de intercambio de fila. En este caso, el término n(n — 1) en la ecuación (6.7) sería reempla- 
zado por 


n 1 5 
Ук -1)= "п = 1), 


k=2 


En consecuencia, esta técnica de pivoteo añadiría О (п? /3) comparaciones, además de las 
[n(n + 1)/2] — 1 divisiones. 


Pivoteo completo 


El pivoteo puede incluir el intercambio tanto de filas como de columnas. El pivoteo comple- 
to (o máximo) en el k-ésimo paso busca todas las entradas а;;, parai = К, К + 1,...,пу 
ј = К, К+1,... ‚п, para encontrar la entrada con mayor magnitud. Los intercambios de fila 
y de columna se realizan para colocar esta entrada en la posición pivote. El primer paso del 
pivoteo total requiere realizar n? — 1 comparaciones, el segundo paso requiere (n — 1)? — 1 
comparaciones, y así sucesivamente. El tiempo adicional total requerido para incorporar el 
pivoteo completo a la eliminación gaussiana es 


Na? 1) = п(п = 1)Qn +5) 
6 
k=2 


comparaciones. El pivoteo completo es, por consiguiente, la estrategia recomendada sola- 
mente para sistemas en los que la precisión es fundamental y la cantidad de tiempo de ejecu- 
ción necesario para este método se puede justificar. 


La sección Conjunto de ejercicios 6.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Definición 6.2 


Definición 6.3 


Definición 6.4 


Ejemplo 1 
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Algebra lineal e inversión de matriz 


Las matrices se introdujeron en la sección 6.1 como un método conveniente para expresar 
y manipular sistemas lineales. En esta sección consideramos cierta álgebra relacionada con 
matrices y muestra cómo se puede utilizar para resolver problemas asociados con sistemas 
lineales. 


Dos matrices A y B son iguales si tienen el mismo número de filas y columnas, digamos, 


n X m, y sí ay; = bij, para cada i = 1, 2,...,пуј = 1,2,...,т. E 


Esta definición significa, por ejemplo, que 


puesto que difieren en dimensión. 


Aritmética de matriz 


Dos operaciones importantes en matrices son la suma de dos matrices y la multiplicación de 
una matriz por un número real. 


Si A y B son matrices, ambas de n X m, la suma de A y B, denotada A + B, es la matriz n X m 
cuyas entradas son а;; + bij, para cada і = 1, 2,...,пуј = 1,2,...,т. ш 


Si A es una matriz n X m y À es un número real, entonces la multiplicación escalar de А y 
A, denotada АА, es la matriz n X т cuyas entradas son Ла, рага cada i =1,2,...,n 


yj=1,2,...,m. п 


Determine А + В у АА, cuando 
2 —1 7 4 2 —8 
а= |; ор йе | | PAST 


Solución Tenemos 


pa -ida dee pisi 
a+B=| 370 1+1 a ld 4 
у 
pa [22 2D 200 ]_[-4 2 -14 
|200) 2. =<201 "|< 0 E 


Tenemos las siguientes propiedades generales para suma de matriz y multiplicación 
escalar. Estas propiedades son suficientes para clasificar el conjunto de todas las matrices 
n X m con entradas reales como espacio vectorial sobre el campo de números reales. 


• Si dejamos que O denote una matriz, donde todas sus entradas son O у —A denota la matriz 
cuyas entradas son —а;. 
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Teorema 6.5 


Definición 6.6 


Ejemplo 2 


Si A, В y C son matrices n X т y À y u son números reales. Se cumplen las siguientes pro- 
piedades de suma y multiplicación escalar: 


i) A+B=B+A, i) (A+B)+C=A+(B+0), 
Ш) AFO=0+A=A, iv) АУА АА 
v) ЛА+В) = ЛА +АВ, vi) (А+ ША =АА+ИА, 
vii) А(ША) = (AWA, viii) 1А = А. 


Todas estas propiedades siguen resultados similares respecto а los números complejos. ш 


Productos matriz-vector 


El producto de matrices también se puede definir en ciertas instancias. Primero considerare- 
mos el producto de una matriz n X m y un vector columna m X 1. 


Sea A una matriz n X m y b un vector columna m-dimensional. El producto matriz-vector 
de A y b, denotado Ab, es un vector columna n-dimensional dado por 


m 
ап ар o am| | bi У aiibi 
m 
dai an ++ am| |b2 Xi- Ob; 
Ab= |, . Р = . Р и 
: н E . , 
Ant Яр сс Anm т ха апі 01 


Para definir este producto, el número de columnas de la matriz A debe concordar con el 
número de filas del vector b y el resultado es otro vector columna con el número de filas que 
concuerda con el número de filas en la matriz. 


3 2 
3 
Determine el producto Absi A= | —1 1 y b= | _1 | А 
6 4 


Solución Puesto que A tiene dimensión 3 X 2 y b tiene dimensión 2 X 1, el producto está 
definido y es un vector con tres filas. Estas son 


3(3)+2(—1)=7, (—1)(3)+1(—1)=—4, y 6(3)+4(—1)= 14. 
Es decir, 
3-2 3 7 
Ab= | —1 1 е —4 |. п 
6 4 14 
La introducción del producto matriz-vector nos permite ver el sistema lineal 


аху + арх +++ + ахь = bi, 


421X1 + 422X2 +++ d29Xp = b2, 


AniX1 + арх +: +++ ахь = bn, 


como la ecuación matricial 
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donde 
а ар ++ An ХІ bi 
азр an аһ х2 b2 
A= , X= ‚ y b= Р 
аһ] аһ2 ++ Admn Xn bn 


puesto que todas las entradas en el producto Ax deben corresponder con las entradas en el 
vector b. Por lo tanto, la matriz n X m se puede ver como una función con dominio en con- 
junto de vectores columna m-dimensional y rango en un subconjunto de vectores columna 
n-dimensional. 


Productos de matriz-matriz 


Podemos utilizar la multiplicación matriz-vector para definir la multiplicación general 
matriz-matriz. 


Definición 6.7 51 А es una matriz n X ту B una matriz т X p. El producto de la matriz de A у В, denotado 
AB es una matriz С п X p cuyas entradas су son 


m 
с = › абы = абу + aizb2j + -++ + атту, 
к=! 


paracadai=1,2,...n,yj=1,2,..., р. ГЫ 


El cálculo де су se puede observar como la multiplicación de las entradas de Іа ¡-ésima 
fila de A con entradas correspondientes en la j-ésima columna de B, seguida por la sumatoria; 


es decir, 
ba; 
[а;1, 4i2,..., Aim] . = бу, 
Бы) 
donde 
m 
с = абу + aizb2j +:**+imbmj = › абу). 
К=1 


Esto explica porqué el número de columnas de A debe ser igual al número de filas de В para 
el producto AB que se va a definir. 
El siguiente ejemplo debería servir para aclarar el proceso de multiplicación de matrices. 


Ejemplo 3 Determine todos los productos posibles de las matrices. 


2 
Аат. a [3153] 
14 
0 1 
С= | -1 р у р- |; к | 
1 2 0 


Solución El tamaño de las matrices es 


A:3x2, B:2x3, C:3x4, y D:2x2. 
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Los productos que se pueden definir y sus dimensiones son 
AB:3x3, BA:2x2, AD:3x2, BC:2x4, DB:2x3, y DD:2x2. 


Estos productos son 


051 zj =5 
AB=| 10 3|, ва=| р AD=|1 0 |, 

14 5 7 e 

2403 =i 0 =з 1 0 
lab рв = | 1 al A рр= | 


Observe que a pesar de que ambos productos de la matriz AB y BA están definidos, sus 
resultados son muy diferentes; ellos ni siquiera tienen la misma dimensión. En lenguaje ma- 
temático, decimos que la operación del producto de la matriz no es conmutativo; es decir, los 
productos en orden inverso pueden diferir. Éste es el caso incluso cuando ambos productos 
se definen y tienen la misma dimensión. Casi cualquier ejemplo mostrará esto, por ejemplo, 


11110111102 Е 01 111110 
1 0||11|]^[0о1| "шз |i ТЕЕ ЛЕСЕ Ы 
Ciertas operaciones importantes relacionadas con el producto de matrices se mantienen, 
como se indica en el siguiente resultado. 


Teorema 6.8 51 А es una matriz n X m, B es una matriz т X k, C es una matriz k X p, D es una matriz 
m X ky Леѕ un número real. Las siguientes propiedades se mantienen: 


а) А(ВС) = (АВ)С; b) А(В + р) = АВ + АР; с) AAB)=(M14)B = А(АВ). 


Demostración La verificación de la propiedad en la parte a) se presenta para mostrar el mé- 
todo involucrado. Las otras partes se pueden demostrar de manera similar. 

Para mostrar que А(ВС) = (АВ)С, calcule la ¡j-entrada de cada lado de la ecuación. BC 
es una matriz т X p con ¡j-entrada 


k 
(ВС),; = Усу. 
1=1 
Por lo tanto, A(BC) es una matriz п X р con entradas 
m m k m k 
авс, = Уво), = Уа, у» Т) Е ТИ 
s=1 s=1 l=1 s=1 l=1 


De igual forma, AB es una matriz n X k con entradas 


m 


(AB)u = X аьа, 


s=1 


por lo que (AB)C es una matriz n X p con entradas 


К К т К т 
[(AB)C];; = X (АВуис = 5 (E Т) cij = YO aisbsucij. 


l=1 l=1 s=1 l=1 s=1 


Definición 6.9 


El término diagonal aplicado 

a una matriz se refiere a las 
entradas en la diagonal que 

van desde la entrada superior 
izquierda hasta la entrada inferior 
derecha. 


Definición 6.10 


Una matriz triangular es aquella 
que tiene todas las entradas cero, 
excepto ya sea encima (superior) 
o debajo (inferior) de la diagonal 
principal. 


Ilustración 
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Al intercambiar el orden de la suma del lado derecho nos da 
m k 
КАВ)С|,; = YY а,Бису = [А(ВС)],, 
s=1 l=1 
рага сайа і = 1, 2,...,пуј = 1, 2,..., р. Рог1о que A(BC) = (АВ)С. ш 


Matrices cuadradas 


Las matrices que tienen el mismo número de filas como columnas son especialmente impor- 
tantes en aplicaciones. 


i) Una matriz cuadrada tiene el mismo número de filas que de columnas. 

ii) Una matriz diagonal D = [d;j] es una matriz cuadrada con 4;; = 0 siempre que 
Aj. 

La matriz identidad de orden n, I, = [8;;], еѕ una matriz diagonal cuyas entradas 


diagonales son todas 1. Cuando el tamaño de /, es claro, en general, la matriz se 
escribe simplemente como /. a 


... 


iii) 


Por ejemplo, la matriz identidad de orden 3 es 


1 0 0 
I=|0 1 0 
0 0 1 
Una matriz n X n triangular superior U = [u;j] tiene, рага cada ¡=1,2,...,n, las 
entradas 
и = 0, рагасадаі = ј +1, / +2,...,п; 
y una matriz triangular inferior L = [/;;| tiene, рага сайа j = 1, 2,..., п las entradas 
пу = 0, рагасайаі = 1, 2,...,ј – 1. ш 


Una matriz diagonal, entonces, es tanto triangular superior como triangular inferior de- 
bido a que sus entradas diferentes de cero deben estar en la diagonal principal. 


Considere la matriz identidad de orden 3, 


1 0 0 
ӊ= |0 1 0 
0 0 1 
Si A es cualquier matriz 3 X 3, entonces 
а ар аз 10.0 а ар аз 
АҺ = | ару an da 0 1 0 |= | ал an аз = А. E 
аз a32 азз 0 0 1 аз\ 432 азз 


La matriz identidad /„ conmuta con cualquier matriz п X п A; es decir, el orden de mul- 
tiplicación no importa, 


[, A = А = АІ,. 


Considere que esta propiedad, en general, no es cierta, incluso para las matrices cuadradas. 
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Definición 6.11 


La palabra “singular” significa 
que algo se desvía de lo 
ordinario. Por lo tanto, una 
matriz singular no tiene inversa. 


Teorema 6.12 


Ejemplo 4 


Matrices inversas 
La inversa de una matriz está relacionada con los sistemas lineales. 


Se dice que una matriz A n X n es no singular (o invertible) si existe una matriz А! п X n 
con AAT! = A7'A = I. La matriz A”! recibe el nombre de inversa de A. Una matriz que 
no tenga inversa recibe el nombre de singular (o no invertible). п 


Las siguientes propiedades respecto a las inversas surgen a partir de la definición 6.11. 
Las pruebas de estos resultados se consideran en el ejercicio 13. 


Para cualquier matriz n X n no singular A: 
i) A`! es única. 
ii) A`! es no singular y (471)! = A. 


iii) 51 В también es una matriz no singular n х n, entonces (AB)! = B7!AT!. m 


Si 
2 5 1 
12 -1 T5 5 75 
2 
A=| 21 0 y B= $ 75 5 
—1 1 2 а 
З 3 3 


Muestre que В = A”! y que la solución para el sistema lineal descrito mediante 


хі +250 = x3=2, 
2x1+ хә =з; 
=x + х +2x3 = 4, 


está dado por las entradas en Bb, donde b es el vector columna con entradas 2, 3 y 4, res- 
pectivamente. 


Solución Primero note que 


2 5 1 
1 2 -1 79 9 59 1 0 0 
АВ=| 21 0 $ 1 ¿3l=|010|=% 
—1 1 2 _1 1 1 0 0 1 
3 3 3 
De forma similar, BA = h, por lo que A y B son no singulares con В = A`! y A = B™!. 
Ahora convierta el sistema lineal dado en una ecuación matricial 
1 2 — ХІ 2 
2 1 0 x |= |3 
=1 1 2 хз 4 
y multiplique ambos lados рог В, la inversa de А. Como 
В(Ах) = (ВА)х=1;х=х y В(Ах) =, 
tenemos 
2 5 1 
9 9 9 1 2 —1 
2 
B Ax = 5 -i 5 2 1 0 х = Хх 
3 3 3 —1 1 2 
9 9 9 


Ilustración 
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y 
2 5 1 7 
79 9 9 2 9 
4 1 2 13 
к! 1 1 4 5 
3 3 3 3 
Esto implica que x = Bb y obtenemos la solución xı = 7/9, x2 = 13/9, y x3 = 5/3. п 


Aunque es fácil resolver un sistema lineal de la forma Ах = b si A7!, se conoce, no es 
computacionalmente eficiente determinar A”! con el fin de resolver el sistema. (Consulte el 
ejercicio 16.) Aun así, es útil desde un punto de vista conceptual describir un método para 


determinar la inversa de una matriz. 


Para encontrar un método para calcular А7! al suponer que A es no singular, observemos 
nuevamente la multiplicación de matrices. Si B; es la j-ésima columna de la matriz n X n B, 


banj 


Si AB = C, entonces la j-ésima columna de C está dada por el producto 


СІ}; ајр 412 

C2j ау an2 
= С, == АВ, = 

Спј Ant Am 


е а b : 

аһ bij k=1 “1k” kj 
n 

an bzj ir ib 

Gan Dnj У. аби) 


Suponga que A”! existe y que А7! = В = (b;). Entonces АВ = Гу 


АВ; = 


о-о 


donde el valor 1 aparece еп la ¡-ésima fila. 


Para encontrar B, necesitamos resolver п sistemas lineales en los que la ¡-ésima columna 
de la inversa es la solución del sistema lineal con el lado derecho de la ¡-ésima columna de 7. 
La siguiente ilustración demuestra este método. 


Para determinar la inversa de la matriz 
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consideremos primero el producto A B, donde B es una matriz arbitraria 3 X 3: 


1 2 —1 bı bn bg 
AB = 2 1 0 ba bn bz 
=1 1 2 ba ba b33 


bii + 2b21 — b31 Ріо + 2b2, — b32 Рз + 2b23 — b33 
= 2b11 + Ро 2b12 + b22 2b13 + b23 
—=b11 +b21+2b31 —b1 + bnz +2b32  —b13 + Роз + 2b33 


Si B = A7!, entonces, AB = I, de manera que 


bi+2b3= Ёз = 1, рр + 2202 — bz = 0, Буз + 2203 — b33 = 0, 
2b11+ ba =0, 2b12 + ba =1, y 223+ ba =0, 
=bn + ba +2b3¡ =0, =b + b22+2b3 = 0, —=b3 + b2+2b33 = 1. 


Observe que los coeficientes en cada uno de los sistemas de ecuaciones son los mismos, el 
único cambio en los sistemas se presenta en el lado derecho de las ecuaciones. Como con- 
secuencia, la eliminación gaussiana se puede realizar en una matriz aumentada formada al 
combinar las matrices de cada uno de los sistemas: 


12 -1:1050 
2 1 0:0 10 
=1 1 210 0 1 


Primero, realice (Е — 2E1) > (Е) y (Ез + Е) > (Ез), seguido de (Ез + Е) > (Ез), 


produce 
1 2-1: 1050 1 2-1: 100 
0 —3 2 1—2 10 у 0-3 2:-2 1 0 
0 3 1: 10 1 0 0 3 :-1 1 1 


La sustitución hacia atrás se realiza en cada una de las tres matrices aumentadas, 


1 2 =] : 1 1 2 =l :0 1 2 =l 0 
0 —3 2 те=2|,|0 =з 2 :1]|,|0 = 20 |, 
оо з: о0о 0 3: 0 0 31 
para, al final, proporcionar 
bi =-}, be=j3, bi = =}, 
ba = $, bn = —5, у Рз= 2, 
by = — 3, Бу) = 1, bz = 1. 


Сото se muestra en el ejemplo 4, éstas son las entradas de A7!: 


з 
l 
> 
[ 
Г ——— 


чәе оь со 
шч л Юел 
шк OIN он 

ки | 


Como observamos en la ilustración, con el fin de calcular A7!,es conveniente configurar 
la matriz aumentada más grande, 


[А El. 


Definición 6.13 


Ilustración 


Teorema 6.14 
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Al realizar la eliminación de acuerdo con el algoritmo 6.1, obtenemos una matriz aumentada 
de la forma 


[Uu т, 


donde U es una matriz triangular superior y Y es la matriz obtenida al realizar las mismas 
operaciones en la identidad / que se realizaron para llevar A a U. 
La eliminación gaussiana con sustitución hacia atrás requiere 
4, 1 4, 3 


3 = 3” multiplicaciones/divisiones y 8" = э" + 6 sumas/restas 


para resolver los n sistemas lineales (consulte el ejercicio 16a). Se debe tener mucho cuidado 
en la implementación para observar las operaciones que no se deben realizar, por ejemplo, 
una multiplicación cuando se sabe que uno de los multiplicadores es la unidad o una resta 
cuando se sabe que el sustraendo es 0. El número de multiplicaciones/divisiones requeridas 
se puede reducir a л? y el número de sumas/restas se puede reducir a п? — 2n? + n (consulte 
el ejercicio 16d). 


Transpuesta de una matriz 


Otra matriz importante relacionada con una matriz dada A es su transpuesta, denotada A”. 


La transpuesta de una matriz A = [а] n X m es la matriz A' = [а], m X n, donde para 
cada i, la ¡-ésima columna de A' es la misma que la ¡-ésima fila de A. Una matriz cuadrada A 
recibe el nombre de simétrica si A = Af. г] 


Las matrices 


72 0 6 4 -—3 
isla |, p=|; Е |}, с-1 4 —2 0 
0 5 —6 3 0 1 
tienen transpuestas 
7 3 0 2 3 6 4 -—3 
A=|2 5 5|, B=]|4 —5 |, Œ= 4 2 
0 -1 -6 T =] =3 0 1 
La matriz С es simétrica porque С’ = С. Las matrices A у В no son simétricas. п 


La prueba del siguiente resultado se sigue directamente de la definición de la transpuesta. 


Las siguientes operaciones relacionadas con la transpuesta de una matriz se mantienen siem- 
pre que la operación sea posible 


) (А) =A, Ш) (ABY = B'A', 
i) (A+B¥ = A+ В, iv) si A7! existe, entonces (А!) = (457!. 
o 


La sección Conjunto de ejercicios 6.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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WEN 6.4 Determinante de una matriz 


Definición 6.15 


La noción de determinante 
apareció de manera 
independiente en 1683 tanto en 
Japón como en Europa, a pesar 
de que ni Takakazu Seki Kowa 
(1642-1708) ni Gottfried Leibniz 
(1646-1716) parecían haber 
usado el término “determinante”. 


Ejemplo 1 


El determinante de una matriz proporciona resultados de existencia y unicidad para sistemas 
lineales que tienen el mismo número de incógnitas y de ecuaciones. Nosotros denotaremos 
el determinante de una matriz cuadrada A mediante detA, pero también es común utilizar la 
notación lAl. 


Suponga que А es una matriz cuadrada. 


i) SiA= [a] es una matriz 1x 1, епіопсеѕ det A = a. 


ii) SiA es una matriz n x п, сопи > 1, el menor М;; es el determinante de la subma- 
triz (n — 1) x (n — 1) de A obtenida al quitar la ¡-ésima fila y la ¡-ésima columna de 
la matriz A. 


iii) El cofactor А;; asociado con M;; está definido por А;; = (—1)!'*/ М. 


iv) El determinante de la matriz А n x n, cuando n > 1, está dado ya sea por 


det A = Эа = У 1) aij Mij, рага і = 1, 2, ...<3M, 
j=l 


j=l 
o mediante 


det A = У ajA; = Da Mi, para cualquier j = 1,2,...,п. ш 
i=l 


і=1 


Se puede mostrar (consulte el ejercicio 12) que calcular el determinante de una matriz 
general n X п mediante esta definición requiere O (n!) multiplicaciones/divisiones y sumas/ 
restas. Incluso para valores relativamente pequeños de n, el número de cálculos se vuelve 
difícil de manejar. 

A pesar de que parece que existen 2n definiciones diferentes de detA, dependiendo de la 
fila o columna seleccionada, todas las definiciones llevan al mismo resultado numérico. La 
flexibilidad en la definición se utiliza en el siguiente ejemplo. Es más conveniente calcular 
detA a lo largo de la fila o de la columna con la mayor cantidad de ceros. 


Encuentre el determinante de la matriz 


Eh 
b 
0H ма U 
ооло о 


mediante la fila o columna con la mayor cantidad de entradas cero. 
Solución Para calcular detA, es más fácil utilizar la cuarta columna: 
det A = a414A14 + а24 Азд + аза Аза + ала Ала = SAz4 = —5M34. 


Al eliminar la tercera fila y la cuarta columna obtenemos 


2 =1 3 
det A = —5det | 4 -—2 7 
6 —6 8 
=2 Y 4 7 4 —2 
=-5{2аа] 7 КЕЕ y | +3 $ ЕЕ и 


Teorema 6.16 


Ejemplo 2 


Tabla 6.2 
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Las siguientes propiedades son útiles para relacionar sistemas lineales y eliminación gau- 
ssiana para determinantes. Estas están probadas en cualquier texto de álgebra lineal estándar. 


Suponga que А es una matriz п X n: 


i) 
ii) 


iii) 


iv) 


v) 


vi) 
vii) 
viii) 


ix) 


Si cualquier fila o columna A sólo tiene entradas cero, entonces det A = 0. 
Si A tiene dos filas о dos columnas iguales, entonces det A = 0. 


Si Á se obtiene a partir de A mediante la operación (Е;) <> (Ey), con i Æ j, 
entonces det A = — det А. 


Si Á se obtiene a partir de A mediante la operación (АЕ;) —> (Е;), entonces 


А = Аде: А. 


Si Á se obtiene a partir de A mediante la operación (E; ++ АЕ) > (Ег) con i # j, 
entonces det A = det A. 


Si B también es una matriz n X n, entonces det AB = det A det B. 
det A' = det A. 
Cuando A”! existe, det A7! = (det А). 


Si A es una matriz triangular superior, triangular inferior o diagonal, entonces 
= п 
А = | la аң. ш 


La parte 1x) del teorema 6.16 indica que el determinante de una matriz triangular es 
simplemente el producto de sus elementos diagonales. Al emplear las operaciones de fila 
dadas en las partes iii), iv) y v), podemos reducir una matriz cuadrada determinada a la forma 
triangular para encontrar su determinante. 


Calcule el determinante de la matriz 


por medio de las partes 111), 1v) y v) del teorema 6.16. 


Solución La secuencia de las operaciones en la tabla 6.2 produce la matriz 


Lo Ll =! 1 
отт $ 
еше ы 

0 0 0 —13 

Por medio de la parte ix), det А = —39, luego det А = 39. E 

Operación Efecto 

ТЕЁ > El det Al = } det A 

E — E, > E) det A2 = det Al = į det A 

E; + Еу > Ез det АЗ = det A2 = ; det A 

E, ЗЕ; > Ед det A4 = det АЗ = į det A 

2E, > E, det AS = 2 det A4 = det A 

Ез — E) > E; det A6 = det AS = det A 

E¿ + $E, > Ey det A7 = det A6 = det A 


Ез © Es 


det A8 = — det A7 = — det A 
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El resultado clave relacionado con no singularidad, eliminación gaussiana, sistemas 
lineales y determinantes es que las siguientes declaraciones son equivalentes. 
Teorema 6.17 Las siguientes declaraciones son equivalentes para cualquier matriz n X n A: 
i) La ecuación Ax = O tiene la solución única x = 0. 


ii) El sistema Ax = b tiene una solución única para cualquier vector de columna n-di- 
mensional b. 


iii) La matriz A es no singular, es decir, existe AL 
iv) detA #0. 


v) La eliminación gaussiana con intercambios de fila se puede realizar en el sistema 
Ax = b para cualquier vector de columna n-dimensional b. ш 


El siguiente corolario para el teorema 6.17 ilustra cómo se puede utilizar el determinante 
para mostrar propiedades importantes sobre matrices cuadradas. 


Corolario 6.18 Suponga que tanto A como В son matrices n X n ya sea con АВ = Го BA = І. Entonces 
B=A'(yA=B"!). 


Demostración Suponga que A B = I. Entonces, por medio de la parte vi) del teorema 6.16 
1 = det(1) = det(AB) = det(A) - det(B), porloque det(A) Æ 0 y det(B) = 0. 


La equivalencia de las partes iii) y iv) del teorema 6.17 implica que existe tanto А! como 
B”!. Por lo tanto, 


SAL = A™' . (AB) = A PAD LB 


Los papeles de A y B son similares, por lo que esto también establece que BA = I. Por lo 
que B = A™!. п 


La sección Conjunto de ejercicios 6.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


N 6.5 Factorización de matriz 


La eliminación gaussiana es la herramienta principal en la solución directa de sistemas de 
ecuaciones lineales, por lo que no debería ser sorprendente que aparezca de otras formas. En 
esta sección, observaremos que los pasos para resolver un sistema de la forma Ax = b se 
pueden usar para factorizar una matriz. La factorización es especialmente útil cuando tiene 
la forma A = LU, donde L es triangular inferior y U es triangular superior. A pesar de que no 
todas las matrices tienen este tipo de representación, muchas se presentan con frecuencia en 
la aplicación de técnicas numéricas. 

En la sección 6.1 encontramos que la eliminación gaussiana aplicada a un sistema lineal 
arbitrario Ax = b requiere O(n*/3) operaciones aritméticas para determinar x. Sin embargo, 
resolver un sistema lineal que implica un sistema triangular superior sólo requiere sustitu- 
ción hacia atrás, que toma O(n?) operaciones. El número de operaciones requeridas para 
resolver un sistema triangular inferior es similar. 

Suponga que A se ha factorizado en la forma triangular A = LU, donde Г, ез triangular 
inferior y U es triangular superior. Entonces podemos resolver para x con mayor facilidad a 
través de un proceso de dos pasos. 


Ejemplo 1 


Tabla 6.3 


La factorización de matrices 

es otra de las técnicas 
importantes que Gauss parece 
haber descubierto primero. 

Está incluida en su tratado de 
dos volúmenes sobre mecánica 
celeste Theoria motus corporum 
coelestium in sectionibus conicis 
Solem ambientium, publicado 
en 1809, 
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e Primero, hacemos y = Ux y resolvemos el sistema triangular superior Ly = b para y. 
Puesto que L es triangular, determinar y a partir de esta ecuación sólo requiere O(n?) ope- 
raciones. 


* Una vez que conocemos y, el sistema triangular superior Ux = y solamente requiere una 
operación O(n?) adicional para determinar la solución de x. 


La resolución de un sistema lineal Ax = b en forma factorizada significa que el nú- 
mero de operaciones necesario para resolver el sistema Ax = b se reduce a partir de 
О(п? /3) a0(Qn?). 


Compare el número aproximado de operaciones requeridas рага determinar la solución para 
un sistema lineal mediante una técnica que requiera О (п? /3) operaciones y una que necesite 
О Оп?) cuando п = 20, п = 100 y n = 1000. 


Solución La tabla 6.3 muestra los resultados de estos cálculos. E 
n п?/3 2n? % de reducción 

10 3.3 x 102 2 x 10? 40 

100 3.3 x 10 2 x 10* 94 

1000 3.3 x 108 2х 106 99.4 


Сото ilustra el ejemplo, el factor de reducción aumenta drásticamente con el tamaño de la 
matriz. No es sorprendente que las reducciones a partir de la factorización tengan un costo; 
la determinación de las matrices específicas L y U requiere O(n”/3) operaciones. Pero, una 
vez que se determina la factorización, los sistemas relacionados con la matriz A se pueden 
resolver de esta forma simplificada para cualquier número de vectores b. 

Para observar qué matrices tienen factorización LU y encontrar cómo se determina, 
primero suponga que la eliminación gaussiana se puede realizar en el sistema Ax = b sin 
intercambios de fila. Con la notación en la sección 6.1, esto es equivalente a tener а, ele- 
mentos pivote diferentes de cero, para cada і =1,2,...,n. 

El primer paso en el proceso de eliminación gaussiana consiste en realizar, para cada 
Ј = 2,3, ... „п, las operaciones 
da 


a)’ 
а 


(Е; = mj1E1) > (E;); donde Mji = (6.8) 


Estas operaciones transforman el sistema en uno en el que todas las entradas en la primera 
columna por debajo de la diagonal son cero. 

El sistema de operaciones en la ecuación (6.8) se puede observar de otra manera. Se 
logra simultáneamente al multiplicar la matriz original A a la izquierda de la matriz 


1 Он. 0 
= т 1 

M” = 0 Е 
: E E e, 0 

т 0з: “071 


Esto recibe el nombre de primera matriz de transformación gaussiana. Nosotros denota- 
mos el producto de esta matriz соп A® = A por A? y con b y b?, por lo que 


А®х = МО Ax = MUb = b®. 
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De manera similar, construimos М, la matriz identidad con entradas por debajo de la 
diagonal en la segunda columna reemplazadas por los negativos de los multiplicadores 


El producto de esta matriz con A? tiene ceros por debajo de la diagonal en las primeras dos 


columnas y hacemos 


A®x = MË AËx = MË M” Ах = м мЬ = Ьб), 


En general, соп Ах = b ya formada, multiplicamos por la k-ésima matriz de 
transformación gaussiana 


o О ОООО 0 
0. 
MW — | ко : > 
— тк. о : 
E 0. | 
0 
A 0 =Ma РИИ o 1 


para obtener 
А0 = MO А®х = М... MO Ax = М®р® = 07) = MV... МО. (6.9) 


El proceso termina con la formación de A™®x = b”, donde A™, es la matriz triangular 


superior 
(1) a) a) 
A AMARA ап 
@ о. : 
Am = 0 а)... 
T i E (n—1) ? 
"e, nln 
() з» >» 0. ай) 
dada por 


AD = MU DM"... MVA. 


Este proceso forma la parte U = Al” de la factorización de la matriz A = LU. Para 
determinar la matriz Г, triangular inferior complementaria, primero recuerde la multipli- 
cación de AWx = b” por la transformación gaussiana de MY utilizada para obtener la 


ecuación (6.9): 
А® Эх = MO А®х = MODO = 0+0 
donde MY genera las operaciones de la fila 


(Еу = т; кЕр) > (Ej), paraj=k+l,...,n. 
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Invertir los efectos de esta transformación y regresar a A® requiere realizar las operaciones 
(Е; + тук Ек) > (Ej) para cada j = k + 1,... ‚п. esto es equivalente a multiplicar por 
la inversa de la matriz M б), la matriz 


LW = [MO] = 


Т б Е е. а" 


La matriz L triangular inferior ер la factorización de A, entonces, es el producto de las 
matrices LV; 


1 0:: is 0 
= 1019 ...100 = | "a Lc a ; 
Mni | 


puesto que el producto de L con la matriz triangular superior U = MD... M® M® A da 


LU = 101,0) Le IA 2) z 0-1), y=) M” 2 y“ Зу... MOMVA 


= гм ¡m9 y" ИЕЭ гм“ 2] м“ D] 1. м“ рм“ Dio. мо МХА == ДУ 
El teorema 6.19 sigue estas observaciones. 


Teorema 6.19 Sila eliminación gaussiana se puede realizar en el sistema lineal Ax = b sin intercambios de 
fila, entonces la matriz A se puede factorizar en el producto de una matriz triangular inferior 
L y una matriz triangular superior U, es decir, A = LU, donde m j; = а? a®, 


a) a) 
а саш неи TE еи o 
D “+, j Е 
0 5 . ^+ тэ 1 ЕЯ 
О = 9 i-t , y L= ы. 0 
n—1,n D 
Dacia 20 аб) Тп] 7777 Mn n-i 1 


Ejemplo 2 a) Determine la factorización LU para la matriz A en el sistema lineal Ax = b, donde 


1 1 0 3 
2 Tal л 1 
A= 3 -1i 1 2 у b=] 3 
ll 2 3 -1 4 


b) Entonces utilice la factorización para resolver el sistema 


х + Xx +3x4= 8, 
2х\+ x2— А3 + м 
3x1 — № = 3 + 204 = 14, 
—x1 + 252 + 3x3 — x4 = —7. 


II 
ÄH 
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Solución а) El sistema original se consideró en la sección 6.1, donde observamos que la 
secuencia deoperaciones (Ез —2E1) > (Ез), (E3 — ЗЕ) > (Ез), (Es — (—1)E1) > (Еа), 
(Ез — 4E2) > (Ез), (E4 — (-3)E2) > (Ед) convierte el sistema en el sistema triangular 


xı + х2 + 3x4= 4, 
= Хә = А3 = 5x4= —7, 
3x3 + 13x4 = 13, 

— 13x4 = —13. 


Los multiplicadores т;; y la matriz triangular superior producen la factorización 


1 1 0 3 1 0 0 0 1 1 0 3 
2 1 -1 1 2 1 0 0 0 =I -1 = 
ке 3 -1 —1 21 3 4 1 0 0 0 3 3B ын 
—1 2 3 —1 —1 —3 0 1 0. 0 0 —13 
b) Para resolver 
1 0 0 0 1 0 3 X1 8 
2 1 0 0 0 -1 -1 —5 X2 7 
a ж A A ыз 
—1 —3 0 1 о 0 0 —13 X4 —7 
primero introducimos la sustitución у = Ux. Entonces b = L(Ux) = Ly. Ез decir, 
| 1 000 ] | yı 8 
_ 2 1 0 0 уз | _ 7 
у=. 3 410 уз 14 
—1 —3 0 1 y4 —7 
Este sistema se resuelve рага y mediante un proceso de sustitución hacia adelante: 
yı = 8; 
2у + у = 7, por loque y, = 7 — 2у = —9; 
Зу +4y2 + уз = 14,  porloque уз = 14 — Зу – 4y2 = 26; 
=у = 3у + y4 = 7, рого дие y4 = —7 + yı + 3 y2 = —26. 
Entonces, resolvemos Ux = y рага х, la solución del sistema original; es decir, 
1 1 0 3 ХІ 8 
0 -1 -1 —5 xa | —9 
0 0 3 13 хз | 26 
0 0 0 —13 X4 —26 
Utilizando la sustitución hacia atrás, obtenemos хд = 2, хз = 0, x2 = —1,x¡ = 3. E] 


La factorización utilizada en el ejemplo 2 recibe el nombre de método de Doolittle y 
requiere que los 1 estén en la diagonal de L, lo cual resulta en la factorización descrita en el 
teorema 6.19. En la sección 6.6, consideramos el método de Crout, factorización que requie- 
re que los elementos en la diagonal de U sean 1, y el método de Choleski, que requiere que 
lii = Ui; para cada i. 

Un procedimiento general para factorización de matrices como un producto de matrices 
triangulares se encuentra en el algoritmo 6.4. A pesar de que se construyen matrices nuevas 
L y U, los valores generados pueden reemplazar las entradas correspondientes de A que ya 
no son necesarias. 

El algoritmo 6.4 permite especificar la diagonal de L o la diagonal de U. 
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Factorización LU 


Para factorizar la matriz n X п А = [а;;] en el producto de la matriz triangular inferior 
L = [1;] y la matriz triangular superior U = [и;;], es decir A = LU, donde la diagonal 
principal ya sea de L o U consta sólo de unos: 


ENTRADA dimensión n; las entradas а; ;, 1 < i, j < n de A; la diagonal 1 = +++ = lan = 1 
de L o la diagonal иу =- +- = Unn = 1 de U. 


SALIDA las entradas /:;,1 < j < 1,1 <i < nde Ly las entradas и;;,і < j < п, 
l<i<ndeU. 


Paso 1 Seleccione [у y иі al satisfacer уи =411. 
Si иу = 0 entonces SALIDA (“Factorización imposible”); 
PARE. 


Paso 2 Para ј = 2,... , п determine иу; =41;/l113 (Primera fila de О.) 
Га =4;1/u11. (Primera columna de L.) 
Paso 3 Parai=2,...,n— 1 haga los pasos 4 y 5. 


Paso 4 Seleccione / y и al satisfacer ин = ан NU киш. 


Si ниң = O entonces SALIDA ('Factorización imposible”); 
PARE. 


Paso 5 Рага j=i+1,...,n 
Determine шу = 1. [ay — Zizi luy); (ésima fila de U) 


Ij = 25 (aj -Eii 1ши). G-ésima columna de L.) 


Uii 
Paso 6 Seleccione ln y Unn al satisfacer lynUnn = Ann — a А: 
(Nota: Si l,,n Unn = 0, entonces А = LU pero А es singular.) 


Paso 7 SALIDA (l;j рага j = 1,...,ѓуі = 1,..., п); 
SALIDA (u; рага j = і,...,пуі = 1,...,п); 
PARE. ш 


Una vez que se completa la factorización de la matriz, la solución de un sistema lineal 
de la forma Ax = LUx = b se obtiene primero, haciendo y = Ux y resolver Ly = b para 
y. Puesto que L es triangular inferior, tenemos 

bi 
yı = 5% 
lu 


у, paracadai=2,3,...,n, 


1—1 
1 
=r bi — Уу; 
п ј=1 


Después de encontrar y mediante este proceso de sustitución hacia adelante, el sistema trian- 
gular superior Ux = y se resuelve para x mediante sustitución hacia atrás con las ecuaciones 


Yn 1 ч 
Ха = Y м= — х= У? их; 


Unn Uii 
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Ilustración 


La multiplicación de la matriz 
AP permuta las columnas de A. 


Matrices de permutación 


En el análisis previo suponemos que Ax = b se puede resolver por medio de eliminación 
gaussiana sin intercambios de fila. Desde un punto de vista práctico, esta factorización es 
útil sólo cuando no se requieren intercambios de fila para controlar el error de redondeo que 
resulta a partir del uso de aritmética de dígitos finitos. Por fortuna muchos sistemas que en- 
contramos al utilizar métodos de aproximación son de este tipo, pero ahora consideraremos 
las modificaciones que se deben hacer cuando se requieren cambios de fila. Comenzamos el 
análisis con la introducción de una clase de matrices que se usan para reordenar, o permutar, 
filas de una matriz determinada. 

Una matriz n X n de permutación P = [p;j] es una matriz obtenida al reordenar las 
filas de /,,, la matriz identidad. Esto produce una matriz con precisamente una entrada dife- 
rente a cero en cada fila y en cada columna, y cada entrada diferente a cero es un 1. 


La matriz 


Y 
1 
оо н 
=. о о 
о-о 


es una matriz de permutación 3 X 3. Para cualquier matriz A 3 X 3, multiplicar a la izquierda 
por P tiene el efecto de intercambiar la segunda y tercera filas de A: 


1 0 0 а ар аз ап ар аз 
РА= |0 0 1 а] an a3 | = | 43 аз азз 
0 1 0 азр аз2 азз da an 42 


De igual forma, multiplicar A a la derecha por P intercambia la segunda y tercera columnas 
de A. ш 


Dos propiedades útiles de las matrices de permutación se relacionan con la eliminación 
gaussiana, la primera de las cuales se ilustra en el ejemplo previo. Suponga que k1, ... , kn 
es una permutación de los enteros 1,...,n y la matriz de permutación Р = (р;;) se define 
mediante 


L sij=K;, 
Pij = 
0, en otro caso. 


Entonces 


e PA permuta las filas de A; es decir, 


akıl @Чк сс Akin 

Ak1 Ak2 сз Akn 
РА = 

ак Чы?  *** п 


e P`! existe y Р! = Р". 


Al final de la sección 6.4, observamos que para cualquier matriz по singular A, el sis- 
tema lineal Ax = b se puede resolver mediante la eliminación gaussiana, sin la posibilidad 
de intercambios de filas. Si conocemos los intercambios de filas requeridos para resolver 
el sistema con eliminación gaussiana, podemos acomodar las ecuaciones originales en un 
orden que garantizaría que no se necesiten intercambios de fila. Por lo tanto, existe una re- 
organización de ecuaciones en el sistema que permite eliminación gaussiana para proceder 
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sin intercambios de fila. Esto implica que para una matriz no singular A, existe una matriz de 
permutación P para la que el sistema 


PAx= Pb 


se puede resolver sin intercambios de fila. Como consecuencia, esta matriz PA se puede 
factorizar en 


PA=LU, 


donde L es triangular inferior y U es triangular superior. Puesto que Р! = P”, esto produce 
la factorización 


A=PLU=(P'LJU. 


La matriz U sigue siendo triangular superior, pero P'L no es triangular inferior a menos que 
Р = І. 


Ejemplo 3 Determine una factorización en la forma А = (Р! L)U рага la matriz 


о Юр 11 
1 1-12 
A=] Ер 20 
1 2 02 


Solución La matriz А no puede tener una factorización LU porque a1; = 0. Sin embargo, utili- 
zarunintercambio de fila (Е) > (Е), seguido por (Ез + E1) > (Ез) y (E4 — Е) > (Еа), 


produce 
1 1 -1 2 
0 0 —1 1 
0.0 1.2 
0 1 1 0 


Entonces el intercambio de fila (E2) <> (E4), seguido de (E4 + Ез) —> (E4), produce la 
matriz 


ш NON 


1 —1 
1 1 
0 1 
o 0 


ооо н 


La matriz de permutación relacionada con los intercambios de fila (Е) > (E2) у (E2) = 


(E4) es 
0100 
0 0 0 1 
P=|o01 0 
1000 

y 

L äi =f 2 
1 2 42 
PASI 1.1 20 
0 =j. 1 
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La eliminación gaussiana se realiza en PA mediante las mismas operaciones que en A, 
excepto sin intercambios de fila. Es decir, (E — Е) > (E2), (Ез + Е) —> (Ез), segui- 
do de (E4 + Ез) > (Ед). Los multiplicadores diferentes a cero para PA son, por consiguiente, 


ma=1, тз = 1, y ma=-l, 


y la factorización LU de PA es 


| 10 0 6] Е 1-1 | 
1 1 0 0 0 1 1.0 
dl E ш 00 125% 
0 0 —1 1 оо оз 
Multiplicar рог Р! = Р“ produce la factorización 
0 0 —1 1 1 1 -—1 2 
-pi pt 1 z 1 0 оо 0 1 1 0 
A= P~ (LU) = P' (LU) = (P'L)U = 10 10 о о Lolo" 
1 1 0.0 оо оз 


La sección Conjunto de ejercicios 6.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WTI 6.6 Tipos especiales de matrices 


Definición 6.20 


Cada entrada de la diagonal 
principal en una matriz 
estrictamente diagonalmente 
dominante tiene una magnitud 
que es estrictamente superior a la 
suma de las magnitudes de todas 
las otras entradas en esa fila. 


Ilustración 


Ahora nos enfocaremos en dos clases de matrices para las que la eliminación gaussiana se 
puede realizar de manera efectiva sin intercambios de fila. 


Matrices diagonalmente dominantes 
La primera clase se describe en la siguiente definición. 


Se dice que la matriz A n X n es diagonalmente dominante cuando 


n 
lail > 5 jaij| se mantiene para cada i = 1,2,..., n. (6.10) 
j=l, 
ізі 
Una matriz diagonalmente dominante es estrictamente diagonalmente dominante 
cuando la desigualdad en la ecuación (6.10) es estricta para cada n, es decir, cuando 


n 
lail > > |а;;1 se mantiene para cada і = 1, 2,..., п. п 
j=1, 
¡Ai 
Considere las matrices 


72 0 6 4 3 
А=|3 5 -1| y B=| 4 —2 0 
0 5 —6 -3 0 1 


Teorema 6.21 
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La matriz no simétrica A es estrictamente diagonalmente dominante porque 
[71 > 121+ 10|, 151 > 13/+|=11, y 1-6] > 101+ 151. 


La matriz simétrica B no es estrictamente diagonalmente dominante porque, por ejemplo, 
en la primera fila, el valor absoluto del elemento diagonal es |6| < |4| + |—3| = 7. Es intere- 
sante observar que А’ по es estrictamente diagonalmente dominante porque la fila del medio 
de А’ es [2 5 5], пі, por supuesto es B’ porque B' = B. a 


El siguiente teorema se utilizó en la sección 3.5 para garantizar que existen soluciones 
únicas para los sistemas lineales necesarios para determinar spline cúbicos interpolantes. 


Una matriz estrictamente diagonalmente dominante A es no singular. Además, en este caso, 
la eliminación gaussiana se puede realizar en cualquier sistema lineal de la forma Ax = b 
para obtener su única solución sin intercambios de fila o columna y los cálculos serán esta- 
bles respecto al crecimiento de errores de redondeo. 


Demostración Primero aplicamos la demostración por contradicción para mostrar que А es 
no singular. Considere el sistema lineal descrito por Ax = 0 y suponga que existe una solu- 
ción distinta a cero x = (x;) para este sistema. Si k es un índice para el que 


0 < |х| = máx |х|. 
1<j<n 
Puesto que У^ ах; = О para cada i = 1, 2,... , п, tenemos, cuando і = k, 
j=1Îijřj 


kkk == 3 AkjXj. 


Ga 


A partir de la desigualdad triangular, tenemos 


п 
lis тав к» | de e sy аыл. 
д ги гд 
Esta desigualdad contradice la dominancia diagonal estricta de A. Por consiguiente, la única 
solución para Ax = 0 es x = 0. Esto muestra, en el teorema 6.17 en la página 298, ser equi- 
valente a la no singularidad de A. 

Para probar que la eliminación gaussiana se puede realizar sin intercambios de fila, 
mostramos que cada una de las matrices АО), AG), ..., А) generadas por el proceso de 
eliminación gaussiana (y descrito en la sección 6.5) es estrictamente diagonalmente domi- 
nante. Eso garantizaría que en cada etapa del proceso de eliminación gaussiana, el elemento 
pivote es distinto a cero. 

Puesto que А es estrictamente diagonalmente dominante, a, 4 0 y A? se puede reali- 
zar. Por lo tanto, para cada i = 2, 3,..., п, 


Ф400 


@ _ 00. бИ . 
ау =ау — m > Рага 2<j<n. 
411 
Primero, ao = 0. La desigualdad triangular implica que 
n n aa D n n а®©а%® 
0) ар Pr aij ii 

A laj Po La >>, ¿O 
j=2 j=2 ј=2 11 


іч іч = ій 
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Definición 6.22 


El nombre definida positiva se 
refiere al hecho de que el número 
x' Ax debe ser positivo siempre 
que x = 0. 


Pero puesto que А es estrictamente diagonalmente dominante, 


п 


(1) (1) a) (1) (1 
Ум |< lap] -lapl y уау] < 1а lazo, 


j=2 
а ji 
por lo que 
(1) ПП) 
(2) (1) [а | F a п) la; la; il 
Ум | < [4421 la; PI ао de 1] — lay) = lap | — СШ 
JA 


La desigualdad triangular también implica que 


Oy (1) 
[а Mie lañ Па; | (1) јат Па; 


< (а — ———— | = |а; 
D, = [6и 0) ii 
ац | laii | 
lo cual nos da 
n 
2) (2) 
Уа 1 < 1а 
¡2 
dd 
Esto establece el dominio diagonal estricto para las filas 2,... , n. Pero la primera fila de А? 


y A son la misma, por lo que A? es estrictamente diagonalmente dominante. 

Este proceso continúa de manera inductiva hasta que se obtiene А triangular superior y 
estrictamente diagonalmente dominante. Esto implica que todos los elementos diagonales son 
diferentes a cero, por lo que se puede realizar la eliminación gaussiana sin intercambios de fila. 

La demostración de estabilidad para este procedimiento se puede encontrar en [We]. ш 


Matrices definidas positivas 
La siguiente clase especial de matrices recibe el nombre de definida positiva. 


Una matriz A es definida positiva si es simétrica y si х' AX > 0 para cada vector n-dimen- 
sional x - 0. н 


No todos los autores requieren simetría de una matriz definida positiva. Por ejemplo, 
Golub y van Loan (GV), una referencia estándar en métodos matriciales sólo requieren que 
х' Ax > 0 para cada x % 0. Las matrices que llamamos definidas positivas reciben el nom- 
bre de definida positiva simétrica en [GV]. Mantenga esta discrepancia en mente si utiliza 
material de otras fuentes. 

Para ser preciso, la definición 6.22 debería especificar que la matriz 1 X 1 generada por 
la operación X' AX tiene un valor positivo para su única entrada ya que la operación se realiza 
de acuerdo con lo siguiente: 


da da сз Qin X1 

Р ай 42 `` An X2 
X Ах = [x1, x2, ке , Xp] 

Ant An сс ап Хп 


п п 


п 
У Dx] 
= [x1,X2,...,Xn] А = NY ajax 


і=1 ј=1 
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Ejemplo 1 Muestre que la matriz 


2 =l 0 
A=| —1 2% =] 
0 —1 2 


es definida positiva. 


Solución Suponga que x es cualquier vector columna tridimensional. Entonces 


2 —1 0 ХІ 
x‘ Ах = [x1, x2, х3] | —1 | хә 
0 —1 2 Хз 


2x1 = х2 
=Í[x1,x2,x3] | ~x + 20 — 23 
=%з + 2x3 


= 2x? —2x1x2 + 2х} —2x2x3 + 2х2. 
Al reorganizar los términos obtenemos 
х' Ах = Ж + (ax? — 2x1 X2 + 45) + (х — 2х2х3 + х2) + X 


= x? + Ол — x2) + (0 — 13) +x%, 
lo cual implica que 
x? + (х — х)? + (x2 — хз)? + х2 >0 


a menos que xı = X2 = хз = 0. 
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A partir del ejemplo debería quedar claro que utilizar la definición para determinar si 
una matriz es definida positiva puede ser difícil. Afortunadamente, existen criterios de ve- 
rificación más fáciles, presentados en el capítulo 9, para identificar a los miembros de esta 
importante clase. El siguiente resultado proporciona algunas condiciones necesarias que se 


pueden usar para determinar ciertas matrices de la consideración. 


Teorema 6.23 Si А es una matriz n X п definida positiva, entonces 


i) A tiene una inversa; ii) а; > 0, para cada = 1, 2,..., п; 
iii) máxi<x ¡<n lax¡| < MáX1<i<n |ай|; iv) (а)? < анау para cada i Æ j. 
Demostración 


i) Six satisface Ах = 0, entonces х' Ax = 0. Ya que A es definida positiva, esto implica 
х = 0. Por consiguiente, Ах = 0 sólo tiene la solución cero. Mediante el teorema 


6.17 en la página 298, esto es equivalente a que A no sea singular. 


ii) Para una į determinada, si х = (xj) se puede definir mediante x; = 1 y х; = 0, si 


j + i. Puesto que x 5 0, 
0 < X AX = a. 
iii) Para k Æ j, defina x = (x;) mediante 
0, sii#jyi#k, 
Xi = 1, 511 = Ja 


=1, sii=k. 
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Definición 6.24 


Teorema 6.25 


Ejemplo 2 


Puesto que х 5 0, 
0 <х'Ах= а; + akk — 4 jk — а. 
Pero A' = A, por lo que ajk = Axj, lo cual implica que 
2а < Ajj + akk- (6.11) 
Ahora defina z = (z;) mediante 


0, sii#jyiÆk, 
Zi = Н 
l, sii=j0i=k. 
Entonces z' Az > 0, por lo que 
241; < Akk Fajj. (6.12) 


Las ecuaciones (6.11) y (6.12) implican que para cada k Æ j, 


< тах la;¡|, por lo que máx |а,;| < máx la;;|. 
2. 1<i<n 1<k, j¡<n 1<i<n 


iv) Para i Æ j,defina x = (хк) mediante 
0, sik#jykÆi, 
X=xX0, sik=1i, 


l, 8 =], 
donde с representa un número real arbitrario. Puesto que х Æ 0, 


0< х' Ах = аңо? + 2ауо +ajj; 


Como polinomio cuadrático en œ sin raíces reales, el discriminante de Р(0) = 
aiia? + 2a¡¡a + a уу debe ser negativo. Por lo tanto, 


2 2 
4a;; — Аана <0 y аг < ана. ш 


A pesar de que el teorema 6.23 provee algunas condiciones importantes que deben ser 
verdaderas para matrices definidas positivas, no garantiza que una matriz que satisfaga estas 
condiciones sea definida positiva. 

La siguiente noción se usará para proporcionar una condición necesaria y suficiente. 


Una primera submatriz principal de una matriz A es una matriz de la forma 


а a ак 
а an ах 
А = E 
aki ао Akk 
para algunas 1 < k < n. п 


Una demostración del siguiente resultado se puede encontrar en [Stew1], p. 250. 


Una matriz simétrica A es definida positiva si y sólo si cada una de sus primeras submatrices 
principales tiene un determinante positivo. п 


En el ejemplo 1 utilizamos la definición para mostrar que la matriz simétrica 


2 =] 0 
A=|-1 2 =] 
0 —1 2 


Teorema 6.26 


Corolario 6.27 


Corolario 6.28 
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es definida positiva. Confirme esto con el teorema 6.25. 
Solución Observe que 


det А = det[2] = 2 > 0, 


det A, = det ol =4-1=3>0, 
—1 2 
y 
2 —1 0 
det Az =det | —1 2 —1 = 2de | 2 IS >] 
—1 2 0 2 
0 —1 2 
=2(4—1)+(—2+0)=4> 0, 
de acuerdo соп el teorema 6.25. E 


El siguiente resultado amplía la parte i) del teorema 6.23 e iguala los resultados estric- 
tamente diagonalmente dominantes presentados en el teorema 6.21 en la página 307. No 
probaremos este teorema porque requiere introducir terminología y resultados que no son 
necesarios para cualquier otro propósito. El desarrollo y la demostración se pueden encontrar 
en [We], p. 120 ff. 


Una matriz simétrica A es una definida positiva si y sólo si se puede realizar eliminación 
gaussiana sin intercambios de fila en el sistema lineal A x = b con todos los elementos pivote 
positivos. Además, en este caso, los cálculos son estables respecto al crecimiento de errores 
de redondeo. п 


Algunos hechos interesantes no cubiertos al construir la demostración del teorema 6.26 
se presentan en los siguientes corolarios. 


La matriz A es definida positiva si y sólo si A se puede factorizar en la forma LDL‘, donde L 
es triangular inferior con números 1 en su diagonal y D es una matriz diagonal con entradas 
diagonales positivas. а 


La matriz А es definida positiva si y sólo si A se puede factorizar en la forma LL‘, donde L es 
triangular inferior con entradas diagonales diferentes a cero. п 


La matriz L en el corolario 6.28 no es igual a la matriz L en el corolario 6.27. Una rela- 
ción entre ellas se presenta en el ejercicio 32. 

El algoritmo 6.25 está basado en el algoritmo de factorización LU 6.4 y obtiene la facto- 
rización LDL' descrita en el corolario 6.27. 


Factorización LDL! 


Para factorizar la matriz A n X п definida positiva en la forma LDL', donde L es una matriz 
triangular inferior con 1 a lo largo de la diagonal y D es una matriz diagonal con entradas 
positivas en la diagonal: 

ENTRADA la dimensión n; entradas a;j, para 1 < i, j < n de A. 

SALIDA las entradas /;;,рага1 < ¡<iyl <i <ndeL,yd;,paral<i < пер. 
Paso 1 Рага і = 1,... ‚п haga los pasos 2—4. 


Paso 2 Рата ј = 1,...,і — 1, determine v; = l;jdj. 
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Corolario 6.29 


Ejemplo 3 


André-Louis Cholesky 
(1875-1918) fue un oficial 
militar francés involucrado en 

la geodesia y la topografía a 
principios de 1900. Él desarrolló 
este método de factorización 
para calcular soluciones a 

los problemas de mínimos 
cuadrados. 
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Paso З Determine di = ai; — у 150. 


Paso 4 Рага ј = і + 1,... ‚п determine lj; = (ан — У Гао) /а. 
Paso 5 SALIDA (l;; рага j = 1,..., – Іуі = 1,..., п); 


SALIDA (а; parai = 1,... , п); 
PARE. п 


El corolario 6.27 tiene una contraparte cuando А es simétrica, pero no necesariamente 
definida positiva. Este resultado se aplica de manera amplia porque las matrices simétricas 
son comunes y se reorganizan con facilidad. 


Si A es una matriz simétrica n X п para el que se puede aplicar eliminación gaussiana sin 

intercambios de fila. Entonces A se puede factorizar en LDL’, donde L es triangular inferior 
Ё y ки 1 ; 

con números 1 en su diagonal y D es la matriz diagonal con a ... а") en su diagonal. ш 


Determine la factorización LDL‘ de la matriz definida positiva. 


4 –1 1 
А= | –1 4.25 2.75 
1 215. 30 


Solución La factorización LDL' tiene números 1 en la diagonal de la matriz triangular infe- 
rior £, por lo que necesitamos tener 


ар 471 азі 1 0 0 dı (0) 0 1 bi l31 
A= а] An a32 = lı 1 (0) 0 а 0 0 1 [зо 
аз 432 433 l31 [зо 1 0 0 da 0 0 1 
а dilo] 41131 
= | dila +412 Ф132 + 411131 


dili 40181 + dzl2 4102 + dal, + d3 


Por lo tanto, 
а1:4= 4 => d¡=4, am: — l1 = 410 => lo = -0.25 


а22:4.25 = 4 + dilà => h = 4 


аз1: 1 = 416) => |В = 0.25, 
a32:2.75 = 410113 + dl => lz = 0.75, а33:3.5 = 010, +d E, +d = d = 1, 


y tenemos 
1 0 0 4 0 0 1 —0.25 0.25 
A = LDĽ' = | —0.25 1 0 0.40 0 1 0.75 |. ш 
0.25 0.75 1 001 о 0 1 


El algoritmo 6.5 se modifica fácilmente рага factorizar las matrices simétricas descritas 
en el corolario 6.29. Simplemente requiere añadir una verificación para garantizar que los 
elementos diagonales sean diferentes a cero. El algoritmo de Cholesky 6.6 produce la facto- 
rización LL”, descrita en el corolario 6.28. 


Ejemplo 4 
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Factorización de Cholesky 
Para factorizar la matriz definida positiva А n X n en LL”, donde L es triangular inferior: 
ENTRADA la dimensión n; entradas а;;, para < i, j < n de A. 


SALIDA las entradas /;;, paral < j <iy1<i <n deL. (Las entradas de U = L' son 
uij =lj, parai<j<yl<i<n.) 


Paso 1 Determine hı = „/ап. 
Paso 2 Paraj=2,...,n,determine lj =4j1/l11. 


Paso 3 Para i = 2,... ‚п — 1 haga los pasos 4 y 5. 


| 1/2 
Paso 4 Determine / = Q = 1) 
Paso 5 Paraj=i+1,...,n 


determine lj; = (aj = їй) ГИТЕ 


äi [2 1/2 
k=1 “nk * 


Paso 7 SALIDA (l;; paraj = 1,...,i yi =1,..., n); 
PARE. п 


Paso 6 Determine lpn = (а — 


Determine la factorización LL' de Cholesky de la matriz definida positiva 


4 –1 1 
А= | —1 425 2.75 
1 2T 3,5 


Solución La factorización LL' no necesariamente tiene números 1 en la diagonal de la ma- 
triz triangular inferior L, por lo que necesitamos tener 


ауу an азі in 0 0 li la dbz 
A= | an an az |=| la | 0 0 ly la 
431 a32 азз la la la 0 0 Л» 
2, lubi ТАП 
=| lia +6 2131 + 2132 
libi 2131 + ізо Bi +10, + 125 
Por lo tanto, 
a: 4= [| => h¡=2, ai: =1= Ш = hı = –0.5 


азу: 1= 11 == hı = 0.5, an: 425 = 1 + == lp=2 


аз: 275 = 1111 +l2b2 => l2 = 1.5, аз: 3.5 = 6+6 +6 == [з = 1, 


y tenemos 


2 0 0 2 
—05 2 0 0. 2 1.5 f п 
05 15 1 0o 0 1 


A=LL'= 


La factorización LDL! descrita en el algoritmo 6.5 requiere 


7 1 1 
-n +n — 6" multiplicaciones/divisiones у Еб — z” sumas/restas. 


6 
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Tabla 6.4 


La factorización LL' de Cholesky de una matriz definida positiva sólo requiere 


1 1 
а су? 


2 1 1 
6 а и multiplicaciones/divisiones у -n° — z” sumas/restas. 


6 


Esta ventaja computacional de la factorización de Cholesky es engañosa porque requiere 
extraer n raíces cuadradas. Sin embargo, el número de operaciones que se necesitan para 
calcular las n raíces cuadradas es un factor lineal de n y disminuirá su importancia conforme 
n aumenta. 

El algoritmo 6.5 provee un método estable para factorizar una matriz definida positiva 
de la forma А = LDL', pero se debe modificar para resolver el sistema lineal Ах = b. Para 
hacerlo, borramos la declaración PARE del paso 5 en el algoritmo y añadimos los siguientes 
pasos para resolver el sistema triangular inferior Ly = b: 


Paso 6 Determine уу = bı. 


Paso 7 Рага і = 2,... ‚п determine у; = b; — Ya ШУ). 


El sistema lineal Dz = y se puede resolver por medio de 
Paso 8 Parai = 1,... ‚п determine z; = y;/d;. 
Finalmente, el sistema triangular superior L'x = z se resuelve con los pasos dados рог 


Paso 9 Determine х, = Zn. 


п 


Paso 10 Parai =n — 1,... determine x; = 2; = Ура lji j 


Paso 11 SALIDA (x; parai = 1,... , п); 
PARE. 


La tabla 6.4 muestra las operaciones adicionales requeridas para resolver el sistema 
lineal. 


Paso Multiplicaciones/divisiones Sumas/restas 
6 0 0 
7 n(n = 1)/2 n(n = 1)/2 
8 п 0 
9 0 0 
10 n(n — 1)/2 n(n — 1)/2 
Total n? п? = п 


Si se prefiere Іа factorización de Cholesky dada en el algoritmo 6.6, los pasos adiciona- 
les para resolver el sistema Ax = b son los siguientes. Primero borre la instrucción PARE 
del paso 7. A continuación, añada: 


Paso 8 Determine у = bı/hı. 


Paso 9 Parai =2,... ‚п determine у; = С — ха у) | lii. 
Paso 10 Determine х, = Yn/ lnn. 
Paso 11 Parai =n — 1,... , determine x; = (y = Уы х) Ju 


Paso 12 SALIDA (x; parai =1,...,n); 
PARE. 


Los pasos 8-12 requieren n? + n multiplicaciones/divisiones y n? — n sumas/restas. 


Definición 6.30 


El nombre para una matriz de 
banda proviene del hecho de que 
todas las entradas diferentes a 
cero se encuentran en una banda 
centrada en la diagonal principal. 
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Matrices de banda 


La última clase de matrices considerada son las matrices de banda. En muchas aplicacio- 
nes, las matrices de banda también son estrictamente diagonalmente dominantes o definidas 
positivas. 


Una matriz n X n recibe el nombre de matriz de banda si existen los enteros p y q con 
1< p,q <n, con la propiedad de que а;; = О siempre que p< j—i oq <i-— j. El 
ancho de banda o banda de una matriz se define como w = р +q — 1. п 


El número р describe el número de diagonales sobre la diagonal principal, incluyendo 
la diagonal principal, en la que pueden encontrar entradas diferentes a cero. El número q 
describe el número de diagonales debajo de la diagonal principal, incluyendo la diagonal 
principal, en la que pueden encontrar entradas diferentes a cero. Por ejemplo, la matriz 


7 2 0 
А= | 3 5 —1 
0 -5 -6 


es una matriz de banda con р = q = 2 y ancho de banda 2 + 2 — 1 = 3. 

La definición de matriz de banda obliga a estas matrices a concentrar todas sus entradas 
diferentes a cero alrededor de la diagonal. Dos casos especiales de matrices de banda que se 
presentan con frecuencia tienen p = q =2yp=q=4. 


Matrices tridiagonales 


Las matrices de ancho de banda 3 se presentan cuando p = q = 2, reciben el nombre de 
tridiagonales porque tienen la forma 


: A 7 аһ 1,п 
ПОРИ АА 0 аһ п-1 ап 


Las matrices tridiagonales también se consideran en el capítulo 11 junto con el estudio de las 
aproximaciones lineales por tramos para problemas de valor en la frontera. El caso p = q = 4, 
se utilizará para solucionar problemas de valor en la frontera al aproximar funciones que 
asumen la forma de splines cúbicos. 

Los algoritmos de factorización se pueden simplificar considerablemente en el caso de matri- 
ces de banda debido al gran número de ceros que aparecen en estas matrices en patrones regulares. 
Es especialmente interesante observar la forma que el método Crout o Doolittle asume en este caso. 

Para ilustrar la situación, suponga que una matriz tridiagonal A se puede factorizar en las 
matrices triangulares L y U. Entonces A tiene máximo (3n — 2) entradas diferentes a cero. 
Por lo que existen solamente (3n — 2) condiciones a aplicar para determinar las entradas de 
Ly U, siempre y cuando, por supuesto, también se obtengan las entradas cero de A. 

Suponga que las matrices L y U también tienen forma tridiagonal; es decir, 


[y О... 0 To Эй. (эзиз 0 
la. Бэ. 0, 1 3. 
L=| 0° у U= 70 
0 Е 
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Hay (2n — 1) entradas indeterminadas de L y (n — 1) entradas determinadas de U, que 
suman (3n — 2), el número de posibles entradas diferentes a cero de A. Las entradas O de A 
se obtienen automáticamente. 

La multiplicación relacionada con A = LU nos da, además de las entradas 0, 


ап = 11; 
Aii-1 = 1-1, рагасайаі = 2,3,..., п; (6.13) 
а = AAA + lii, para cada i = 2; З. E UA (6.14) 
y 
афі = Ги рага cada i = 15 2, Е i бшер 1. (б.15) 


Una solución para este sistema se encuentra al utilizar primero la ecuación (6.13) para 
obtener los términos fuera de la diagonal diferentes a cero en £ y después, con las ecuaciones 
(6.14) y (6.15) para obtener de manera alternativa el resto de las entradas en U y L. Una vez 
que se calcula una entrada L o U, la entrada correspondiente en A no es necesaria. Por lo que, 
las entradas en A se pueden sobrescribir mediante las entradas en £ y U con el resultado de 
que no se requiere almacenamiento nuevo. 

El algoritmo 6.7 resuelve un sistema n X n de ecuaciones lineales cuya matriz de coefi- 
ciente es tridiagonal. Este algoritmo solamente requiere (5n — 4) multiplicaciones/divisio- 
nes y Gn — 3) sumas/restas. Por consiguiente, tiene una ventaja computacional considerable 
sobre los métodos que no consideran la tridiagonalidad de la matriz. 


Factorización de Crout para sistemas lineales tridiagonales 


Para resolver el sistema lineal n X n 


Er: ах + 412X2 = аһ, 
E2: ах] + 422X2 + 423X3 = Mn+, 
En=1 : ап—1,п—2Хп—2 + An 1,п 1Xn—1 + An 1,пХп = An—1.n+1> 
E, : An, n—1¥n—1 + annXn = @п,п+1› 


que se supone que tiene una solución única: 
ENTRADA la dimensión n; las entradas de A. 
SALIDA la solución x¡,... , Xp. 


(Los pasos l-3 configuran y resuelven Lz = b.) 


Paso 1 Determine / = а; 
uy = 2/11; 
21 = dipti 011. 
Paso 2 Parai = 2,...,п — 1 determine /;; = а;:-1; (i-ésima fila de L.) 
li = ai = алир 
Uiii = Gi i+1/ lii; (G + 1)-ésima columna de U.) 
Zi = (Qi n41 — li, i—12i—1)/ lii- 
Paso З Determine ln n-1 = an,n—1; (enésima fila de L.) 
Lan = Ann — ГТО РЕ ТРЕ 


Zn = (An.n+1 = lania) lmn: 
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(Pasos 4 y 5 resuelven U x = 2.) 


Paso 4 Determine х, = Zn. 


Paso 5 Parai =n —1,... ,1 determine x; = Zi — Ui i+1Xi+1- 
Paso 6 SALIDA (x1,... , Xn); 
PARE. 


Ejemplo 5 Determine la factorización de Crout de la matriz tridiagonal simétrica 
2-1 0 0 
-1 2-1 0 
0-1 2 -l 
0 0-1. 2 


y utilice esta factorización para resolver el sistema lineal 


2x1 — X2 = 1, 
—x1 +2x2— x3 =0, 
= 0 +253 – x4=0, 

— Хз + 2х4 = 1. 


Solución La factorización LU de A tiene la forma 


Га о 0 0 | Е о 0 Oy ж 0 | 
д | 91 92 аз 01 1а b2 0 0 0 1 из 0 
0 ар аз ад | | 0 lo la 0 0 0 1 им 
0 O адз ад 0 0 la м 0 0 0 1 
П Гир 0 0 
_| 21 22 +1ир l22423 0 
0 b2 l33 + l32u23 l33U34 
0 0 laz las + l43u34 
Por lo tanto, 
ay: 2= 1 => ln =2, ар: = 1= ир = un =}, 
daa: -1= 1 => lhi=-1, an: 2=l2+lbiu => 10 = $, 
az: = 1 = оиз = из = —2, a: = 1 = 132 = 180 = 1, 
as: 2=l3+l2u3 => әз = 4, a4: – 1 = зиз = им = —3, 
азі -1= 1з = Із = 1, аад: 2 = ly + азиза => las = 5. 
Esto nos da Ја factorización de Crout 
2-1. 0 0 о оо 1-3 0 0 
=h <= 0 A 2 00 E To= Ü 
E = 2 3 = 
и 0—1 2 ~I -1 3 0||o 0 1 = Б 
0 0-1 2 0 0-1 3 0. 0 0 1 
Al resolver el sistema 
1 
2 0 00 a 1 ži 2 
1 ¿00|l|2 0 2 3 
= 2 = == 3 
Lz= o -i 4 0 а ll ME nos da | Т l ; 
0 0-1: Za 1 24 1 
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y al resolver 


1 
1-3 0 0 xı ] 2 xı ] | 1 ] 
0 1-2 0 хә 3 x 1 
2 3 = 3 2 
Ох = 0 0 1 2 Ае 1 nos da Е 1 ш 
0 0 0 1 Xa 1 Xa 1 


El algoritmo de factorización Crout se puede aplicar siempre que l; 4 0 para cada 
і =1,2,...,n. Dos condiciones, cualquiera que garantice que esto es verdad, son que la 
matriz de coeficientes del sistema es definida positiva o que es estrictamente diagonalmente 
dominante. Una condición adicional que garantiza la aplicación de este algoritmo se propor- 
ciona en el siguiente teorema, cuya demostración se considera en el ejercicio 30. 


Teorema 6.31 Suponga que A = [а;] es tridiagonal con a;;-14; ¡+1 A 0, рага cada i =2,3,...,n—1. 
51|а11] > [ало |, laiul > la; ¡11 + la; ¡411, para cada i =2,3,...,n—1, y |а| > lļan,n-1l, 
entonces А es no singular y los valores de l;; descritos en el algoritmo de factorización Crout 
son diferentes a cero para cada i =1,2,...,n. Г 


La sección Conjunto de ejercicios 6.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


|] ў 6.7 Software numérico 


El software para operaciones de matriz y la solución directa de sistemas lineales imple- 
mentados en IMSL y NAG está basado en LAPACK, un paquete de subrutinas de dominio 
público. Existe excelente documentación y libros disponible acerca de ellos. Nosotros nos 
enfocaremos en varias subrutinas disponibles en las tres fuentes. 

LAPACK de acompañamiento es un conjunto de operaciones de nivel inferior llamadas 
Subprogramas Básicos de Álgebra Lineal (BLAS). En general, el nivel 1 de BLAS consiste 
en Operaciones vector-vector, como sumas de vector con datos de entrada y conteo de ope- 
raciones de O(n). El nivel 2 consiste en operaciones matriz-vector, como el producto de una 
matriz y un vector con datos de entrada y conteo de operaciones de O(n?). El nivel 3 consiste 
en operaciones matriz-matriz, como productos de matriz con datos de entrada y conteo de 
Operaciones de О(п?). 

Las subrutinas en LAPACK рага resolver sistemas lineales primero factorizan la matriz A. 
La factorización depende del tipo de matriz de la siguiente forma: 


1. Matriz general РА = LU 

2. Matriz definida positiva A = LL' 

3. Matriz simétrica A = LDL! 

4. Matriz tridiagonal A = LU (en forma de banda) 
Además, se pueden calcular inversas y determinantes. 

La Biblioteca IMSL incluye contrapartes para casi todas las subrutinas LAPACK y tam- 
bién algunas extensiones. La Biblioteca NAG tiene numerosas subrutinas para métodos di- 


rectos para resolver sistemas lineales similares a los de LAPACK e IMSL. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Técnicas iterativas en álgebra de matrices 


Introducción 


Las vigas son estructuras livianas capaces de sostener cargas pesadas. En el diseño de puen- 
tes, las partes individuales de las vigas están conectadas con uniones orientables que permi- 
ten transferir las fuerzas desde una parte de la viga hasta otra. La figura adjunta muestra una 
viga sostenida de manera estacionaria en el extremo izquierdo inferior ® permite movimien- 
to horizontal en el extremo derecho inferior @ y tiene uniones еп O, O, @ y O. Una carga de 
10000 newtons (N) se coloca en la unión @ y las fuerzas resultantes en las uniones provistas 
por fi, Р, f, f4 y fs, como se muestra. Cuando son positivas, estas fuerzas indican tensión en 
los elementos de la viga y, cuando son negativas, compresión. El miembro de soporte esta- 
cionario podría tener tanto un componente de fuerza horizontal Е; como un componente de 
fuerza vertical Ёз, pero el miembro de soporte movible sólo tiene un componente de fuerza 
vertical F3. 


10000 N 


Si la viga está en equilibrio estático, las fuerzas en cada unión se deben sumar al vector 
cero, por lo que la suma de los componentes horizontales y verticales en cada unión debe 
ser 0. Esto produce el sistema lineal de ecuaciones que se muestra en la tabla adjunta. Una 
matriz de 8 x 8 que describe este sistema tiene 47 entradas cero y sólo 17 entradas diferentes 
a cero. Las matrices con un alto porcentaje de entradas cero reciben el nombre de dispersas 
y, a menudo, se resuelven utilizando métodos iterativos en lugar de técnicas directas. La so- 
lución iterativa a este sistema se considera en el ejercicio 15 de la sección 7.3 y en el ejercicio 
10 en la sección 7.4. 


Unión Componente horizontal Componente vertical 
@ „+0 +5=0 Lp – Е. = 

Ө) Bar 0 = 0 -Z 8-1) 0 
9 =f+f=0 Js — 10,000 =0 

Ф -L fh- = 0 І Е = 0 
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Un escalar es un número real 
(o complejo) que por lo general 
se denota con letras itálicas 

o griegas. Los vectores se 
representan por medio de letras 
negritas. 


Definición 7.1 


Definición 7.2 Las normas h у læ para el vector x = (x1, X2, .. 


= Técnicas iterativas en álgebra de matrices 


Los métodos que se presentan en el capítulo 6 usaban técnicas directas para resolver 
un sistema de n X n ecuaciones lineales de la forma Ax = b. En este capítulo presentamos 
métodos iterativos para resolver un sistema de este tipo. 


2 7.1 Normas de vectores y matrices 


En el capítulo 2 describimos las técnicas iterativas para encontrar raíces de ecuaciones de 
la forma f(x) = 0. Se encontró una aproximación inicial (о aproximaciones) y, después, 
se determinaron aproximaciones nuevas con base en qué tan bien satisfacían la ecuación las 
aproximaciones previas. El objetivo es encontrar una forma de minimizar la diferencia entre 
las aproximaciones y la solución exacta. 

Para analizar los métodos iterativos que resuelvan sistemas lineales, primero necesitamos 
determinar una forma para medir la distancia entre vectores columna n-dimensionales. Esto 
nos permitirá determinar si una sucesión de vectores converge a una solución del sistema. 

En la actualidad, esta medida también se necesita cuando la solución se obtiene con los 
métodos directos presentados en el capítulo 6. Estos métodos requerían un gran número de 
Operaciones aritméticas y utilizar aritmética de dígitos finitos sólo conduce a una aproxima- 
ción para una solución real del sistema. 


Normas de vector 


Sea que R”, denota el conjunto de todos los vectores columna n-dimensionales con compo- 
nentes de números reales. Para definir la distancia en R”, usamos la noción de una norma, 
que es la generalización del valor absoluto en К, el conjunto de números reales. 


Una norma vectorial en R”, es una función, || - |, de R”, a R, con las siguientes propiedades: 


i) |х| > 0 para toda x € R”, 


ii) [Ix]| = 0 si y sólo si x = 0, 
iii) ||æx|| = |æ|||x]|| para toda œ € R y x € R”, 
iv) [Ix+yll < |х| +Ilyl] para toda x, y € R”. m 


Los vectores en R”, son vectores columna y es conveniente usar la notación de la trans- 
puesta presentada en la sección 6.3 cuando un vector se representa en términos de sus com- 
ponentes. Por ejemplo, el vector 


X2 


Xn 


se escribirá x = (x1, X2, ... , Xp). 
Sólo necesitaremos dos normas específicas en R”, a pesar de que se presenta una tercera 
norma en R”, en el ejercicio 9. 


., Xn) se definen mediante 


n 1/2 
= 2 = А А 
хз = {ух | у Ixl = máx |х. 


i=1 
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Observe que cada una de estas normas se reduce al valor absoluto para el caso n = 1. 
La norma h recibe el nombre de norma euclidiana del vector x porque representa la no- 
ción común de distancia desde el origen cuando x está еп R! = R, R? o №. Por ejemplo, 
la norma /» del vector х = (x1, x2, хз)! provee la longitud del segmento recto que une los 
puntos (0,0, 0) у (хі, x2, хз). La figura 7.1 muestra la frontera de esos vectores en R? y R? 
que tienen una norma l menor a 1. La figura 7.2 es una ilustración similar de la norma læ. 


Figura 7.1 


X2 À 


Los vectores en el 

Los vectores en R? primer octante de R? 
con la norma l, menor con la norma /, menor 
a 1 se encuentran dentro а 1 están dentro de esta 
de esta figura. (0,0,1) figura. 


(1,0) 
> 


Хү | 
(1,0,0) (0, 1,0) 


Х| X2 


Figura 7.2 


XA 


(0, 1) (1,1) 


xj 
(1,0) 


(= 1:1) (0, = 1) (1,=1) (1, 1,0) 


Los vectores en R? con la norma Los vectores en el primer octante de 
lo menor a 1 se encuentran R? con la norma /„ menor a 1 se 
dentro de esta figura. encuentran dentro de esta figura. 
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Ejemplo 1 


Teorema 7.3 


Existen muchas formas de esta 
desigualdad, por lo tanto, muchos 
descubridores. Augustin Louis 
Cauchy (1789-1857) la describió 
en 1821 en Cours d'Analyse 
Algébrique (Curso de análisis 
algebraico), el primer libro sobre 
cálculo riguroso. Una integral 

de la forma de la igualdad 
aparece en el trabajo de Viktor 
Yakovlevich Bunyakovsky 
(1804-1889) en 1859 y Hermann 
Amandus Schwarz (1843-1921) 
usó una forma de integral doble 
de esta desigualdad en 1885. 
Más detalles sobre la historia se 
pueden encontrar en [Stee]. 


Determine la norma l y la norma l% del vector x = (—1, 1, —2Y. 


Solución El vector x = (—1, 1, —2)' en R? tiene las normas 


Ixl = VED? + (1)? + (2? = v6 


Ixl = máx(] — 11, 111, |= 2|} = 2. и 


Es fácil mostrar que las propiedades en la definición 7.1 mantienen la norma э porque 
siguen resultados similares para valores absolutos. La única propiedad que requiere más de- 


mostración es iv) y, en este caso, si X = (X1,X2,... , Xn) у Y = (у, Y2, --- , Jn)”, entonces 
1х + y lloo = máx |х; + y] < máx (х;| + |y: < máx |х| + máx |y;| = |х| + llylloo- 
1<і<п 1<і<п 1<і<п 1<і<п 


Las primeras tres condiciones también son fáciles de demostrar para la norma lz. Pero 
para mostrar eso 


1х + y ll2 < IIxll2 + llyll2, para cada x, y € К, 


necesitamos una desigualdad famosa. 


(Desigualdad Cauchy-Bunyakovsky-Schwarz para sumas) 


Por cada х = (х, х2,..., х.) у у = (у, Y2, ---, yn) en R”, 
1/2 


n n n 
xy = Уху = Ух? Уу = IIxll2 + 


i=1 i=1 і=1 


1/2 


ур. (7.1) 


Demostración Si у = 0 ox = 0, el resultado es inmediato porque ambos lados de la 
desigualdad son cero. 
Suponga que y = 0 ух Æ 0. Observe que para cada A є R tenemos 


0 < IIx – Ау = a -iyi = Ni 24 Nes +1 У», 
i=l i=l ¡=1 ¡=1 
por lo que 
25 үр? < Na +2? Ny = |х|$ +2 y 1. 
¡=1 i=l ¡=1 
Sin embargo lIx!l» > 0 y ly ll > 0, por lo que podemos hacer à = ||х||о/[|у||; para obtener 


ша _ 2 el 2 
272 ху | < хр + уз = 21х10. 
| [ЕЁ 2, A Е 


Por lo tanto, 


Z [ИЙ 
20 xyi < A jz = 2IIx/l211y 12, 
i=l 


Definición 7.4 


Ejemplo 2 
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n n 1/2 n 1/2 
“у = uy = ныр = (927) (3%) н 


ї=1 ї=1 i=1 


Con este resultado vemos que para cada x, y € R”, 
n n n n 
\х+у = 06 + 0) = 17420 +0 уу < [хр + 21Ixl21Iy lla + УР. 
i=l і=1 i=l і=1 


que proporciona la propiedad iv) de la norma: 


1/2 
Іх + y lla < (11х15 + 211x112 уо + у) E = 1х1 + УІ. 
Distancia entre vectores en R” 


La norma de un vector proporciona una medida para la distancia entre un vector arbitrario 
y el vector cero, de la misma forma en la que el valor absoluto de un número real describe 
su distancia desde 0. De igual forma, la distancia entre dos vectores está definida como la 
norma de la diferencia de los vectores al igual que la distancia entre dos números reales es el 
valor absoluto de su diferencia. 


Si x= (X1, х0,...,х,) Y у = (у, Y2, ---, Jn)" son vectores en R”, las distancias lz y lo 
entre х y y se definen mediante 


п 1/2 
Ix – y llo = (e 57} у 1х — yllo = máx Lo — yil. и 
і=1 
El sistema lineal 

3.3330x1 + 15920х› — 10.333x3 = 15913, 


2.2220х + 16.710x> + 9.6120x3 = 28.544, 
1.5611x¡ + 5.1791х2 + 1.6852x3 = 8.4254, 


tiene la solución exacta х = (x1, х2, x3) = (1, 1, 1). La eliminación gaussiana realizada 
mediante aritmética de redondeo de cinco dígitos y pivoteo parcial (algoritmo 6.2) produce 
la solución aproximada 


Š = (1, 20, Хз)! = (1.2001, 0.99991, 0.92538)'. 
Determine las distancias l2 у l% entre las soluciones exactas y aproximadas. 


Solución Las mediciones de x — X están dadas por 


Ix — |16 = máx(]1 — 1.2001], |1 — 0.99991|, |1 — 0.92538|) 
= máx(0.2001, 0.00009, 0.07462} = 0.2001 


Ix — 10 = [а — 1.2001)? + (1 — 0.99991)? + (1 —0.92538)]'” 
= [(0.2001)? + (0.00009)? + (0.07462)?]!? = 0.21356. 


A pesar de que los componentes X2 y Хз son buenas aproximaciones рага хә y хз, el compo- 
nente Х| es una aproximación débil para xı у |ху — | domina ambas normas. ш 
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Definición 7.5 


Teorema 7.6 


Ejemplo 3 


Teorema 7.7 


El concepto de distancia en К” también se usa para definir una cota de una sucesión de 
vectores en este espacio. 


Se dice que una sucesión {х9}, de vectores еп R” converge а x respecto a la norma 
si, dado cualquier e > 0, existe un entero N (€) tal que 


(k) 


|x“ — xl] <£, рага ода k > N(e). ш 


La sucesión de vectores {Хх} converge а x en R” respecto a la norma læ si у sólo si 
p k 
lím >o x! ls Xi, para cada і =1,2,...,n. 


Demostración Suponga que {х} converge а x respecto a la norma lœ. Dado cualquier 
e > 0, existe un entero N (€) tal que para toda k > N (e), 


|х (k) __ 


тах — | = |х х| < £. 
¿=1,2,«58 
2 A К р 
Este resultado implica que xí = xi| < в, para сайа ¡=1,2,...,n, por lo que 
; k А 
Ит; оо х; = x; para cada i. 
: Р Ms a 
Por el contrario, suponga que йти. ох; = X; para сада? = 1,2,...,n. Para un 


€ > 0, dado, sea №; (e) para cada i representa un entero con la propiedad de que 


k 
la? — xil <e, 


siempre que k > №; (=). 
Defina N (e) = máx;¡=1.2....n № (€). Si k > N (e), entonces 


máx |х = | = 1х0 — xlloo < е. 
ї=1,2,....п 
Esto implica que {х} converge а x respecto a la norma læ. п 


Muestre que 


1 3 
хб = (к у „к? = (1 2 + К? Д2' e™ sen 0) * 


converge а x = (1,2, 0, 0) respecto a la norma loo. 
Solución Puesto que 


lím 1=1, lm(Q+1/k)=2, lím3/k=0 у Ите senk = 0, 
k=>00 Коо k=>00 


k=>00 


el teorema 7.6 implica que la sucesión {х} converge a (1, 2, 0, 0)' respecto a la norma la. 
a 


Mostrar directamente que la sucesión en el ejemplo 3 converge a (1, 2, O, 0) respecto a 
la norma l, es bastante complicado. Es mejor probar el siguiente resultado y aplicarlo a este 
caso especial 


Para x є R”, 


Ixl < [хә < Vr |х|. 


Figura 7.3 


Ejemplo 4 
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Demostración Si x; es una coordenada de x de tal forma que |х|. = тах |х| = |х|. 
Entonces 


n 
2 2 2 2 2 
Me = k? = x} Уа = 8 
ї=1 


у 
х1. < 11х12. 
Por lo que, 
х5 = У 37 < Y х2 = пх? = п||х| у. 
1=1 i=l 
у хб < valix- и 


La figura 7.3 ilustra este resultado cuando n = 2. 


En el ejemplo 3, encontramos que la sucesión {х}, definida por 
t 
e™ sen 0) > 


converge а x = (1,2,0,0)' respecto a la norma lœ. Muestre que esta sucesión también 
converge a x respecto a la norma /2. 


1 3 
быы ТЭ ды и = 
X CR: 


Solución Dado cualquier e > 0, existe un entero N(e/2) con la propiedad de que 


\х® —xlloo < >, 
siempre que k > N(e/2). Mediante el teorema 7.7, esto implica que 


\х® — хо < /4|х® — xlloo < 2(є/2) = e, 


cuando k > N(e/2). Рог lo que (x0) también converge a x respecto a la norma /». ш 
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Definición 7.8 


Teorema 7.9 


Cada norma vectorial produce 
una norma matricial natural 
asociada. 


Corolario 7.10 


Se puede mostrar que todas las normas en К” son equivalentes respecto a la convergen- 
cia; es decir, si y ' son dos normas cualquiera sobre R” у {х}, tiene el límite x 
respecto a ||. |, entonces {x}? | también tiene el límite x respecto a || + ||’. La prueba de este 
hecho рага el caso general se puede encontrar en [Or2], р. 8. El caso para las normas la y loo 
se siguen el teorema 7.7. 


Normas matriciales y distancias 


En las siguientes secciones de este capítulo y en capítulos posteriores, necesitaremos méto- 
dos para determinar la distancia entre matrices n X n. Para ello se requiere el concepto de 
norma. 


Una norma matricial sobre el conjunto de las matrices n X n es una función de valor real 
, definida en este conjunto, que se cumple para todas las matrices A y Bn X n y todos los 


números reales œ: m 
i) All > 0; 
ii) A|| = 0, si y sólo si A es O, la matriz con todas las entradas 0; 


ii) [a Al = 11А; 
iv) 114+BI < 141+ 181; 
v) |AB| < 4111181. m 


La distancia entre matrices A y B n X n respecto a esta norma matricial es || А — B ||. 

A pesar de que las normas matriciales se pueden obtener de diversas maneras, las que se 
consideran con mayor frecuencia son las que son consecuencias naturales de las normas de 
vectores /5 y loo. 

Estas normas se definen al utilizar el siguiente teorema, cuya prueba se considera en el 
ejercicio 17. 


Si || + |, es una norma vectorial еп R”, entonces 
Al = máx || Ах || (72) 
es una norma matricial. ш 


Las normas matriciales definidas por normas vectoriales reciben el nombre de normas 
matriciales naturales, o inducidas, asociadas con la norma del vector. En este texto, se asu- 
mirá que todas las normas matriciales son naturales a menos que se especifique lo contrario. 

Para cualquier z Æ 0, el vector x = z/ |12 es un vector unitario. Por lo tanto, 


— = máx Я 
iiz z#0 ||7|| 


¿ llAzI| 


АІ ш izi ` (1.3) 


máx || Ax|| = máx 
х=! 70 


y, alternativamente, podemos escribir 


El siguiente corolario para el teorema 7.9 sigue esta representación de || А ||. 


, tenemos 


para cualquier vector z 4 0, matriz A y cualquier norma natural 


. 


42| < 1А 


21|. н 


7.1 Normas de vectores y matrices 327 


La medida dada a una matriz bajo la norma natural describe la forma en la que la matriz 
extiende los vectores unitarios relativos a esa norma. La extensión máxima es la norma de la 
matriz. Las normas de la matriz que consideraremos tienen las formas 


IA llo. = máx 
х= 


lloo 


i ILAxlloo, la norma loo, 


y 
А2 = máx [Ax], la norma /2. 
Ixl2=1 
Una ilustración de estas normas cuando n = 2 se muestra en las figuras 7.4 y 7.5 para 
la matriz 


Figura 7.4 


Figura 7.5 


|х| = 1 
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Teorema 7.11 


La norma læ de una matriz se puede calcular fácilmente a partir de las entradas de la 


matriz. 
n 


Si A = (а) es una matriz n X n, entonces || Allo. = 22 5 [а; 3]. 
j=1 


п 
Demostración Primero, mostramos que || Alla, < máx х. |а; 3]. 
sisne 
Sea х un vector n-dimensional соп 1= ||Хх|| = MáX1<i<n |х|. Puesto que Ax también 
es un vector n-dimensional 


lAxlloo = máx іх (Ax); | = máx > aijxj| < máx з laij] ш mi íx xjl. 
1< 1<і<п |4 1<i<n 
j=l 
Pero máxi<j<n |х| = ||Х|| = 1, por lo que 


n 


Axl], < máx › la;;l, 
1<і<п 
j=l 
y, por consiguiente, 


АП = тах ||Axllo < máx 2, laijl. (7.4) 


ШЧ l<i<n 


Ahora mostraremos la desigualdad opuesta. Si p es un entero con 


n n 

apj| = máx 5 а 
> lap;| = máx У 1а] 
j=1 j=1 


y Xes el vector con componentes 


Xj = 
=1, 81 ар =0 
Entonces |х| = 1 y аху = |apj|, para todas las j = 1, 2,... ,n, por lo que 
n n n 
| Ах = máx >) > 2а) = Elo = = máx у lay, 


Este resultado implica que 


п 


ПА = тах [| Axlloo > máx Уа. 
IIXlloo=1 Isisn E 


Al unir esto con la desigualdad (7.4) obtenemos [А = máx Xx Y, la;;l. п 
Ј=1 


Ejemplo 5 


7.2 Eigenvalores y eigenvectores 


Determine || Alloo para la matriz 


1 2 =] 
А= | 0 3 —1 
5 =] 1 


Solución Tenemos 


3 3 
Уа =11+121+1-11=4, У =/01+13/+|-11=4, 


j=1 j=l 


3 


У 181 = 151+1- 11+ Ш =7. 


j=! 


Por lo que el teorema 7.11 implica que || All. = máx{4, 4, 7) = 7. 
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En la siguiente sección, veremos un método alternativo para encontrar la norma /› de 


una matriz. 


La sección Conjunto de ejercicios 7.1 está disponible en línea. Encuentre la ruta de 


acceso en las páginas preliminares. 


SS] 7.2 Eigenvalores y eigenvectores 


Una matriz n X m se puede considerar como una función que utiliza multiplicación de matri- 
ces para tomar vectores columna m-dimensionales en vectores columna n-dimensionales. Por 
lo que, una matriz n X т es, en realidad, una función lineal de R” a R”. Una matriz cuadrada 
A toma el conjunto de vectores n-dimensionales en sí misma, lo cual provee una función 
lineal de R” a R”. En este caso, ciertos vectores x diferentes de cero podrían ser paralelos a 
Ax, lo que significa que existe una constante А con Ax = Ax. Para estos vectores, tenemos 
(А – АГ)х = 0. Existe una conexión cercana entre los valores de A у la probabilidad de que 


Definición 7.12 


Definición 7.13 


El prefijo eigen proviene del 
adjetivo alemán que significa 
“propio” y en inglés es sinónimo 
de la palabra característico. Cada 
matriz tiene una eigenecuación 

о característica propia, con 
eigenvalores o funciones 
característicos correspondientes. 


un método iterativo convergerá. Nosotros consideraremos la conexión en esta sección. 
Si A es una matriz cuadrada, el polinomio característico de A está definido por 


pO) = det(A – АГ). 


No es difícil demostrar (consulte el ejercicio 15) que p es un polinomio de enésimo grado 
y, por consiguiente, tiene por lo menos n ceros diferentes, algunos de los cuales podrían ser 
complejos. Si А es un cero de p, entonces, puesto que det(A – 11) = 0, el teorema 6.17 en 
la página 298 implica que el sistema lineal definido por (A — A1)x = 0 tiene una solución 
con x Æ 0. Nos gustaría estudiar los ceros de p y las soluciones diferentes a cero correspon- 


dientes a estos sistemas. 


Si p es el polinomio característico de la matriz A, los ceros de p reciben el nombre de 
eigenvalores, o valores característicos, de la matriz A. Si A es un eigenvalor de A y x Æ 0 
satisface (А — AL)x = 0, entonces x es un eigenvector, o vector característico, de A corres- 


pondiente al eigenvalor A. 
Para determinar los eigenvalores de una matriz, podemos utilizar el hecho de que 


e les un eigenvalor de A si y sólo si det(A — 11) = 0. 
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Ejemplo 1 


Figura 7.6 


Una vez que se ha encontrado el eigenvalor A, un eigenvector correspondiente x 52 0 se 
determina al resolver el sistema 


e (А— Арх = 0. 


Muestre que no hay vectores x diferentes a сего en R? con Ax paralelo a х si 
0 1 
ds | КЕ: | | 


Solución Los eigenvalores de A son los ceros del polinomio característico 


0 = det(A = AD) = des | 2 2 | =A, 
por lo que los eigenvalores de A son los números complejos Ау = іу А = —i. Un eigen- 


vector х correspondiente a Лу necesita satisfacer 


о 1 xı | | —ixi+x 
0| |—1 — хо | | —xi—ix2 |” 
es decir, 0 = —¿x1 + x2, por lo que х = ¿x¡,y0= —x¡ — ix2. Por lo tanto, si x es un ei- 


genvector de A, entonces exactamente uno de sus componentes es real y el otro es complejo. 
Por consiguiente, no hay vectores х diferentes de cero en R? con Ax paralela ах. п 


Si x es un eigenvector asociado con el eigenvalor real А, entonces Ах = Ax, por lo que 
la matriz A transforma el vector x en un múltiplo escalar de sí mismo. 


• Si àes real y à > І, entonces A tiene el efecto de expandir x en un factor de A, como se 
ilustra en la figura 7.6 a). 


e 51 0< à < 1, entonces A comprime х en un factor de A (consulte la figura 7.6 b)). 


e Sià < 0, los efectos son similares (consulte la figura 7.6 с) y d)), a pesar de que la direc- 
ción de Ax está invertida. 


b)1>1>0 


También observe que si x es un eigenvector de A asociado con el eigenvalor Л y а es 
cualquier constante diferente a cero, entonces ох también es un eigenvector ya que 


А(ах) = a (AX) = a (àx) = Ax). 


Una consecuencia importante de esto es que para cualquier norma vectorial ||- ||, podríamos 
seleccionar œ =+||x||7*, lo cual resultaría en ax como el eigenvector con norma 1. Por lo que, 


e Para todos los eigenvalores y cualquier norma vectorial, existen eigenvectores con norma 1. 
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Ejemplo 2 Determine los eigenvalores y eigenvectores рага la matriz 


Solución El polinomio característico de A es 


pO)=det(A—AI)=det| 1 1-4 2 
1 ыр‘ 4—А 


== =7Pé416:=10)==4 —=3)(А =2)?, 


por lo que existen dos eigenvalores de A: А = Зул = 2. 
Un eigenvector xı correspondiente al eigenvalor Ал = 3 es una solución para la ecua- 
ción de vector-matriz (А — 3 + 1)x, = 0, por lo que 


0 A 00 х\ 
ral 1-22 хэ |, 
0 1—1 1 хз 


lo cual implica que xı = 0 y x2 = x3. 

Cualquier valor diferente de cero de x3 produce un eigenvector para el eigenvalor 
А = 3. Por ejemplo, cuando хз = 1, tenemos el eigenvector x; = (0, 1, 1)”, y cualquier 
eigenvector de A correspondiente a 4 = 3 es un múltiplo diferente a cero de хі. 

Un eigenvector х % 0 de A asociado con А = 2 es una solución del sistema 
(A — 2. Г)х = 0, por lo que 


0 о 00 ХІ 
0 |к 11-1 2 х2 
0 E 2 X3 


En este caso, el eigenvector sólo tiene que satisfacer la ecuación 
xı — х2 + 2x3 = 0, 


lo cual se puede realizar de diferentes formas. Por ejemplo, cuando ху = 0, tenemos 
хә = 2x3, рог lo que una elección sería x2 = (0, 2, 1)'. También podríamos seleccio- 
паг хо = 0, lo cual requiere que xı = —2x3. Рог lo tanto, хз = (-2, 0, 1) da un segundo 
eigenvector para el eigenvalor Аз = 2 que no es un múltiplo de x2. Los eigenvectores de A 
correspondientes al eigenvalor А = 2 generan un plano entero. Este plano se describe 
mediante todos los vectores de la forma 


охо + Вхз = (28, 20, о + BY, 


para constantes arbitrarias о y ff, siempre y cuando al menos una de las constantes sea 
diferente de cero. ш 


Las nociones de los eigenvalores y los eigenvectores se introducen aquí para convenien- 
cia computacional específica, pero estos conceptos surgen con frecuencia en el estudio de 
sistemas físicos. De hecho, puesto que son bastante interesantes el capítulo 9 está dedicado 
a su aproximación numérica. 


Radio espectral 


Definición 7.14 El radio espectral о(А) de una matriz A está definido por 


p(A) = máx |А], donde A es un eigenvalor de A. 
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Teorema 7.15 


Ejemplo 3 


(Para à = а + Ві, complejo, definimos |A| = (a? + 8?)!?.) ш 


Рага la matriz considerada en el ejemplo 2, p(A) = máx(2, 3} = 3. 
El radio espectral está estrechamente relacionado con la norma de una matriz, como se 
muestra en el siguiente teorema. 


Si A es una matriz n X n, entonces 


0 ПА = [0(А'А)]!, 


ii)  p(A) < |А, para cualquier norma natural ||. ||. 


Demostración La demostración de la parte 1) requiere más información respecto a los eigen- 
valores actualmente disponibles. Para los detalles relacionados con la demostración, consul- 
te [Or2], p. 21. 

Para probar la parte 11), suponga que A es un eigenvalor de A con eigenvector х y 
|х|| = 1. Entonces Ax = AX y 


А = 1А 11 = Axl = Ax] < ПАХІ = IAI. 
Por lo tanto, 
p(A) = máx [A] < ||А|. a 


La parte i) del teorema 7.15 implica que si A es simétrica, entonces || A ll, = p(A) (con- 
sulte el ejercicio 18.) 

Un resultado interesante y útil, que es similar a la parte 11) del teorema 7.15, es que para 
cualquier matriz A y cualquier e > O, existe una norma natural || - || con la propiedad de que 
о(А) < AI < p(A) + =. Por consiguiente, p(A) es la cota inferior más grande para las 
normas naturales en A. La prueba de este resultado se puede encontrar en [Or2], p. 23. 


Determine la norma l de 


11.0 
A= 1.2 1 
=] 1 2 


Solución Para aplicar el teorema 7.15, necesitamos calcular p(A*A), por lo que primero 
necesitamos los eigenvalores de A' A: 


1.1 =l 1 0 32 =l 
АА= |1 2 1 2 1! = 26 4 
O 1 2 =1 1 2 —1 4 5 
Si 
3=A 2 —1 


0 = det(A'A – АГ) =det | 2 6—ì 4 
=l 4 5-1 


= – А + 142 — 424 = —A (à? — 142 + 42), 


mediante à = 0 о 4 = 7 + v7. Mediante el teorema 7.15, tenemos 


ПА|2 = v P(A A) = y/máx(0, 7 – М7,7+ v} = л+л м 3.106. и 
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Matrices convergentes 


Al estudiar técnicas de matrices iterativas, es especialmente importante saber cuándo las po- 
tencias de una matriz se vuelven pequeñas (es decir, cuando todas las entradas se aproximan 
a cero). Las matrices de este tipo reciben el nombre de convergentes. 


Definición 7.16 Llamamos convergente a una matriz A n X n si 


Jím (А8) =0, paracadai=1,2,...,nyj=1,2,...,n. н 
>00 


Ejemplo 4 Muestre que 


> 

Ш 
эе юе 
о 


кю 


es una matriz convergente. 


Solución Al calcular las potencias de A, obtenemos 


1 1 1 
т 0 = 0 = 0 
2_|4 з | 8 4_ | 16 
а 1 1f? A 3 1? = И 
4 4 16 8 8 16 
y, en general, 
lyk 
a [0 0 
= k К 
т бу) 
Por lo que А es una matriz convergente porque 
lí гү = 0 lí n 0 
belz] T к я 


Observe que la matriz convergente A еп el ejemplo 4 tiene p(A) = 1 porque Тев el único 
eigenvalor de A. Esto ilustra una conexión importante que existe entre el radio espectral de 
una matriz y la convergencia de la matriz, como se detalla en el siguiente resultado. 


Teorema 7.17 Las siguientes declaraciones son equivalentes 
i) A es una matriz convergente 
ii) Ито [| А” || = 0, para alguna norma natural. 
iii) И, о 114” [| = 0, para todas las normas naturales. 
iv)  p(4)<l. 


v) Ит, > A"x = 0, para cada x. ш 


La demostración de este teorema se puede encontrar en [IK], р. 14. 


La sección Conjunto de ejercicios 7.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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Ejemplo 1 


Carl Gustav Jacob Jacobi 
(1804-1851) fue reconocido en 
primer lugar por su trabajo en 

el área de la teoría de números 

y funciones elípticas, pero 

sus intereses matemáticos y 
capacidades eran muy amplias. 
Tenía una personalidad fuerte 
que influyó en el establecimiento 
de una actitud orientada hacia la 
investigación que se convirtió en 
el centro del resurgimiento de las 
matemáticas en las universidades 
alemanas en el siglo XIX. 


Técnicas iterativas de Jacobi y Gauss-Siedel 


En esta sección describimos los métodos iterativos de Jacobi y Gauss-Siedel, métodos clá- 
sicos que datan de finales del siglo хуш. Las técnicas iterativas casi nunca se usan para 
resolver sistemas lineales de dimensiones pequeñas ya que el tiempo requerido para suficien- 
te precisión excede el requerido para las técnicas directas, como la eliminación gaussiana. 
Para grandes sistemas con un alto porcentaje de entradas 0, sin embargo, estas técnicas son 
eficientes en términos tanto de almacenamiento como de cálculo computacional. Los siste- 
mas de este tipo surgen con frecuencia en análisis de circuitos y en la solución numérica de 
problemas de valor en la frontera y ecuaciones diferenciales parciales. 

Una técnica iterativa para resolver el sistema lineal n X п Ax = b inicia con una aproxi- 
mación х para la solución x y genera una sucesión de vectores {х }2 у que convergen a x. 


Método de Jacobi 


El método iterativo de Jacobi se obtiene al resolver la ¡-ésima ecuación en Ах = b para х; 
para obtener (siempre que а; 4 0) 


п 
(A 
=> , 

dii dii 


j=1 
JA 


рага і = 1, 2,...,п. 


k ; : 
Рага cada k > 1, genere los componentes xl dex” a partir de los componentes de х) 
por medio de 


n 


1 
(k) (&—1) к= 
к) __ У — ах; bil, =d Эз жуЁй 7.5 
*i dii j=1 ( А pj ) Е рата? ús ( ) 
Hi 


El sistema lineal Ax = b dado por 


Ei: 10x1— x2+ 2x3 = 6, 
Es: —xi+llx-=— Аз +324 = 25, 
Ез: 2x1 = хә+10хз— x4=-ll, 
Ez: 3x2 x3+8x4=15 


tiene la solución única x = (1, 2, —1, 1)”. Utilice la técnica iterativa de Jacobi para encontrar 
aproximaciones x0 para x, que inicia con x®™ = (0,0,0,0) hasta 


k k-1 
П — xé lo 


< 107°. 
|х loo 


Solución Primero resolvemos la ecuación Е; para х;, para cada i = 1, 2,3,4, а fin de obtener 


1 1 

X = 1027 z% tz 
1 1 3 25 

X2 = тх! + 1? t ТЕ 
1 1 11 
ЕТТ + 1024 107 
15 

х4 = = 50 + 7% ЕА 


7.3 Técnicas iterativas de Jacobi y Gauss-Siedel 


A partir de la aproximación inicial x® = (0, 0, 0, 0)' tenemos x'” provista por 


Las 


wo hp- Lp уз. 
a AA 
P=- Ma +p- IL- 
xa = ч p + “=, de в = 


iteraciones adicionales, x® = С e, xP 


presentan en la tabla 7.1. 


0.6000, 


2.2727, 


335 


by se d imil 
> Хд у generan de manera similar y se 


Tabla 7.1 
k 0 1 2 3 4 © 6 7 8 9 10 
к? 0.000 0.6000 1.0473 0.9326 1.0152 0.9890 1.0032 0.9981 1.0006 0.9997 1.0001 
g9 0.0000 2.2727 1.7159 2.053 1.9537 2.0114 1.9922 2.0023 1.9987 2.0004 1.9998 
х9 0.0000 —11000 —08052 —10493 —09681 —10103 —0.9945 —1.0020 —0.9990 —1.0004 —0.9998 
Хх 0.0000 1.8750 0.8852 1.1309 0.9739 1.0214 0.9944 1.0036 0.9989 1.0006 0.9998 
Nos detuvimos después de 10 iteraciones porque 
PRI BR 107 e 
— < 107°. 


РДЕ 


De hecho, ||х(19 — х||,, = 0.0002. 


1.9998 


En general, las técnicas iterativas para resolver sistemas lineales implican un proceso 
que convierte el sistema Ax = b en un sistema equivalente de la forma x = Тх-+Ес para una 
matriz fija T y vector с. Después de seleccionar el vector inicial x®, la sucesión de los vec- 
tores solución aproximados se generan al calcular 


х® = Тх0 +e, 


рага cada k = 1, 2, 3,... Esto debería recordar la iteración de punto fijo estudiada en el 
capítulo 2. 
El método de Jacobi se puede escribir en la forma х = Т х) + e al dividir A en sus 
partes diagonal o fuera de la diagonal. Para observar esto, permita que D sea la matriz diago- 
nal cuyas entradas diagonales sean las de A, —L es la parte estrictamente triangular inferior 


de A y —U es la parte estrictamente triangular superior de A. Con esta notación, 


а 12 

а an 
А = 

ап An 
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se divide en 


a Oss 0 Dinar ni las 0 0-.—ај +2: аһ 
РЕ 0 - 122 ы | FRE Е Е С. 
` „Л А : —@п—1,п 
Ое 10 ам =й а 0 О “0 
=D-L-U 


Entonces, la ecuación Ax = b, о (D — L — U)x = b, se transforma en 
Dx = (L + О)х +b, 
y, si existe ЮС, es decir, si аң Æ 0 para cada i, entonces 
x= D! (L + U)x + рг. 
Esto resulta en forma matricial de la técnica iterativa de Jacobi: 
x® =D" 1 + О)х@) + рт, 


КЕ укын ме (7.6) 


Al introducir la notación T; = DUL+U) ye j= D-!b obtenemos la forma de la técnica 
de Jacobi 
х® = Тук 0 фе. (7.7) 


En la práctica, la ecuación (7.5) se usa en el cálculo y la ecuación (7.7) para propósitos 
teóricos. 


Exprese el método de iteración de Jacobi para el sistema lineal Ax = b dado por 


Ei: 10x1— x2+ 2x3 = 6, 
Es: —xi+llx-=— Аз +324 = 25, 
Es: 2х = х + 10х3 – x4=-ll, 
Ед: 3x2 — хз + 8х4 = 15, 


en la forma х = Tx% + e. 


Solución En el ejemplo 1 observamos que el método de Jacobi para este sistema tiene la 
forma 


1 
Xx] = 107 = 5% Ta 
1 1 3 + 25 
х X х X 3 
ктү изи n 
ИИ ТЕТ. pipat 
саш кат 1075 T0 
3 15 
X4 = = ga + —X3 + z 
Por lo tanto, tenemos 
1 1 3 
о w 73 0 5 
1 1 3 25 
L 0 4 „з 25 
Т = 11 11 11. у е 11 ш 
л у L u 
5 10 1 10 
3 1 15 
003 в з 


El algoritmo 7.1 implementa la técnica iterativa de Jacobi. 


Phillip Ludwig Siedel (1821- 
1896) trabajó como asistente de 
Jacobi resolviendo problemas 
sobre sistemas de ecuaciones 
lineales que derivaron del 
trabajo de Gauss sobre mínimos 
cuadrados. En general, estas 
ecuaciones tienen elementos 
fuera de la diagonal que son 
mucho más pequeños que los 
de la diagonal, por lo 

que los métodos iterativos son 
especialmente efectivos. Las 
técnicas iterativas que en la 
actualidad se conocen como 

de Jacobi y Gauss-Siedel eran 
previamente conocidas por 
Gauss antes de aplicarse en 
esta situación; sin embargo, era 
frecuente que los resultados 

de Gauss no se difundieran 
ampliamente. 
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Técnica iterativa de Jacobi 
Para resolver Ах = b dada una aproximación inicial x0%: 


ENTRADA el número de ecuaciones y valores desconocidos n; las entradas a;j, 1 < i, ј < п 
de la matriz A; las entradas b;,1 < i < n de b; las entradas ХО;,1 < i < n de ХО = x®; 
tolerancia TOL; número máximo de iteraciones N. 


SALIDA la solución aproximada xı, .. 
número de iteraciones. 


. , Xn О ип mensaje que indica que se excedió el 


Paso 1 Determine k = 1. 
Paso 2 Mientras (k < N) haga los pasos 3-6. 


Paso З Рага і = 1,...,п 


1 
determine x; = — |— > 'j=1 (а; ХО) + bil. 
aii jżi 
Paso 4 Si|lx — ХО|| < TOL entonces SALIDA (x1, ..., Xn); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 5 Determine k = К + 1. 
Paso 6 Parai = 1,..., п determine ХО; = xi. 


Paso 7 SALIDA (‘número máximo de iteraciones excedido’); 
(El procedimiento no fue exitoso.) 
PARE. E 


El paso 3 del algoritmo requiere que а;; 4 0, рага cada i =1,2,...,n. Si una de las 
entradas a;; es 0 y el sistema es no singular, se puede realizar una reorganización de las ecua- 
ciones de tal forma que а;; = 0. Para acelerar la convergencia, las ecuaciones se deberían 
reordenar de tal forma que a;; resulte tan grande como sea posible. Este tema se analiza con 
mayor detalle más adelante en este capítulo. 

Otro posible criterio para detenerse en el paso 4 es iterar hasta que 


k k—1 
px )— yí Y 


1х9 | 


es más pequeña que parte de la tolerancia prescrita. Para este propósito, se puede utilizar 
cualquier norma conveniente, la más común es la norma læ. 


El método Gauss-Siedel 


Una posible mejora en el algoritmo 7.1 se puede observar al reconsiderar la ecuación (7.5). 
Los componentes de х!) se usaban para calcular los componentes х{® de x“. Pero, para 
i > 1, los componentes х{®, ЕЗ х®, dex“) уа se han calculado y se espera que sean me- 
jores aproximaciones para las soluciones reales X1,... ,Xj-1 qUe ху ,... a . Por 
lo tanto, parece razonable calcular хеч usando estos valores calculados recientemente. Es 


decir, utilizar 


1 1—1 п 

k k k-1 

х{ = a — 5 (ajx! ») = 5 (ajx! н) +6; |, (7.8) 
н j= j=i+1 

para cada і = 1,2,...,n, en lugar de la ecuación (7.5). Esta modificación recibe el nombre 


de técnica iterativa Gauss-Siedel y se ilustra en el siguiente ejemplo. 
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Ejemplo 3 Utilice la técnica iterativa Gauss-Siedel para encontrar soluciones aproximadas para 


10х| = м + 2x3 = 6, 
=ху + llx2— x3 + 3x4 = 25, 
2х — м + 10x3 = x4 = –11, 
3x2 — x3 + 8х4 = 15, 


que inicia con х = (0, 0, 0, 0) e iterando hasta que 


k k-1 
Ix® = x“? læ% 


“10°, 
1х loo 


Solución La solución x = (1, 2, —1, 1) se aproximó usando el método de Jacobi en el 
ejemplo 1. Para el método Gauss-Siedel, escribimos el sistema, para cada К = 1,2,... сото 


х® = к^ ч + а 
х = а + E q + a 
е -х® + i + e _ а 


Cuando x® = (0,0,0,0)', tenemos х() = (0.6000, 2.3272, —0.9873, 0.8789)”. Los valo- 
res de las iteraciones subsiguientes se muestran en la tabla 7.2. 


х® 0.0000 0.6000 1.030 1.0065 1.0009 1.0001 

Ж? 0.0000 2.3272 2.037 2.0036 2.0003 2.0000 

xP 0.0000 —0.9873 —1.014 —1.0025 — 1.0003 — 1.0000 

ЖО? 0.0000 0.8789 0.9844 0.9983 0.9999 1.0000 
Puesto que 


Ix® — x® llo _ 0.0008 
[хб os 2.000 


= 4х 107%, 


хб) se acepta como aproximación razonable para la solución. Observe que el método de 
Jacobi en el ejemplo 1 requería el doble de iteraciones para la misma precisión. п 


Para escribir el método de Gauss-Siedel en forma matricial, multiplique ambos lados de 
la ecuación (7.8) por а; y recopile los k-ésimos términos iterados para obtener 


(0) 


k k 
ax; ' +аох + + анх} ( 


(к—1) k—1 
= —ашыхц = linx + bi, 
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рага cada і =1,2,...,n. Al escribir todas las n ecuaciones nos da 
k k=1 k-1 = 
anx” = ax" — азд — =D, 
k k 6-1 Е. 
anxi? + anx” = -anx ? — ... — amx P + bn, 
k k 
ах ; + amx, ) рее дн = bn; 


con las definiciones de D, L, y U proporcionadas previamente, tenemos el método Gauss- 
Siedel representado por 


(D — І)х® = Ох) +b 


x® = (р — Du" +(D-Ly lb, para сайа k=1,2,.... (79) 


Si permitimos que Т, = (D — 1) Сусе, = (р — L)7!b, obtenemos la técnica Gauss- 
Siedel de la forma 


х = TxD te. (7.10) 


Para la matriz triangular inferior D — L no singular, es necesario y suficiente que а; 4 0, para 
cadai=1,2,...,n. 
El algoritmo 7.2 implementa el método Gauss-Siedel. 


Método iterativo Gauss-Siedel 


Para resolver Ах = b dada una aproximación inicial x®: 


ENTRADA el número de ecuaciones y valores desconocidos n; las entradas a;j, 1 < i, j < п 
de la matriz A; las entradas b;, 1 < i < n deb; las entradas ХО;,1 < i < n de XO = x®; 
tolerancia TOL; número máximo de iteraciones N. 


SALIDA la solución aproximada x1, .. . , х, о un mensaje que indica que se superó el número 
de iteraciones. 


Paso 1 Determine k = 1. 
Paso 2 Mientras (k < N) haga los pasos 3-6. 


Paso З Рага і = 1,...,п 


1 1—1 п 
Determine х; = — |— Ху i XO; +0; 
айп 2, 212) D fij + 
Jal j=i+1 
Paso 4 Siļ||x— ХО|| < TOL entonces SALIDA (x1, ..., Xn); 


(El procedimiento fue exitoso.) 
PARE. 


Paso 5 Determine k =k +1. 
Paso 6 Parai = 1,..., п determine ХО; = xi. 


Paso 7 SALIDA (‘Número máximo de interacciones excedido’); 
(El procedimiento no fue exitoso.) 
PARE. ш 
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Lema 7.18 


Los comentarios que siguen al algoritmo 7.1 respecto a los criterios de reorganización e 
interrupción también se aplican al algoritmo 7.2 de Gauss-Siedel. 

Los resultados de los ejemplos 1 y 2 parecen implicar que el método Gauss-Siedel es 
superior al método de Jacobi. Esto casi siempre es verdad, pero existen sistemas lineales para 
los que el método de Jacobi converge y el método de Gauss-Siedel no (consulte el ejercicio 
9 y 10). 


Métodos de iteración general 


Para estudiar la convergencia de técnicas de iteración general, necesitamos analizar la 
fórmula 


х® = тх®-? +c, paracadak=1,2,..., 


donde x® es arbitraria. El siguiente lema y el teorema 7.17 en la página 333 dan la clave 
para este estudio. 


Si el radio espectral satisface p(T) < 1, entonces (1 — Т)! existe, y 


оо 
И-ту = ътът? +: = Ут). 
j=0 


Demostración Puesto que Tx = Ах es verdad precisamente cuando (1 — Т)х = (1 — А)х, 
tenemos А como un eigenvalor de T precisamente cuando 1— à es un eigenvalor de 7 — T. 
Pero |A] < о(Т) < 1, por lo que à = 1 no es un eigenvalor de Ту 0 no puede ser un eigen- 
valor de 7 — Т. Por lo tanto, (Z — Т)! existe. 

Sea Sm = I +T +T? +--+ Т". Entonces 


(Т = Ту$„ АЕБ p TIT T r EN Y 
y puesto que T es convergente, el teorema 7.17 implica que 


lím (I — Т)8, = lím Q- 7") = 1. 


m-—>00 


Por lo tanto, (I — Т)! = іт, о Sm = I +T +T? +- = Уо Тї. ш 


Teorema 7.19 Рага cualquier х є R”, la sucesión {x }% definida por 


х® = TxD +c, para cada k > 1, (7.11) 
converge a la solución única de x = Tx + с si y sólo si p(T') < 1. 
Demostración Primero suponga que p(T) < 1. Entonces, 


х® = Tx% +e 
= Т(Тх 2 фе) +c 
= Т2х 2 + (Т + Г)е 


= Т*х@® 4+ (T! р... 4 T + Ре. 
Puesto que p(T') < 1, el teorema 7.17 implica que T es convergente y 


lím T*x0 = 0. 
k=>00 


Corolario 7.20 
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El lema 7.18 implica que 


оо 

lím x® = lím Т*х® Tİ | e= 1 Т) 'e= (1 – Т) е. 

аа р Более 
J= 


Por lo tanto, la sucesión {х} converge al vector x = (1 —T)leyx=Tx+c. 

Para probar lo contrario, mostraremos que para cualquier z € R”, tenemos lím ¿+0 
T*z = 0. Con el teorema 7.17, esto es equivalente a p(T') < 1. 

Sea z un vector arbitrario y x la única solución рагах = Tx + е. Definax% =x-—z, 
y, para k > 1,х® = Tx“=D + с. Entonces {х} converge а x. También, 


х—х® =(Tx+0c)- (7х) +e) =T (х х0), 
por lo que 


х-х®©=Т (х xD) = Т? (х = A] Sisin TI (x = х®) = T*z. 


Por lo tanto, lím роо T*z = Ип › Т“ (x — x®) = limeso (x — x®) =0. 
Pero z € R” era arbitrario, por lo que mediante el teorema 7.17, T es convergente y 
p(T)< 1. ш 


La prueba del siguiente corolario es similar alas pruebas en el corolario 2.5 en la página 47. 
Se considera en el ejercicio 18. 


Si ||T|| < 1 para cualquier norma matricial normal у e es un vector determinado, entonces 
la sucesión {х'®}°° , definida por х) = Tx“=D + e converge, para cualquier x® є R”, 
para un vectorx € R”, con x = Tx + с, y las siguientes cotas de error se mantienen: 


Ч К k 0 р .. k 
0 Ix—xP 1 17110 х5 y хх < 0х0 – х0]. 


Hemos observado que las técnicas de Jacobi у Gauss-Siedel se pueden escribir como 
х® = Ta +с, y х® = añ +C; 
usando las matrices 
T¡=D"UL+U) y T¿=(D-L)UU. 


Si p(T;) o о(Т,) es menor a 1, entonces la sucesión correspondiente puja, convergerá a 
la solución x de Ax = b. Por ejemplo, el esquema de Jacobi tiene 


х® =D HLE+UKED + р-1Ь, 
y si (x0322, converge a x, entonces 
x=D"(L+U)x+0D"!b. 
Esto implica que 
Dx=(L+Ux+b y (р- 1 - Ох =. 


Puesto que D — L — U = А, la solución x satisface Ах = b. 

Ahora podemos proporcionar condiciones de suficiencia verificadas fácilmente para con- 
vergencia de los métodos de Jacobi y de Gauss-Siedel. (Para probar la convergencia para el 
esquema de Jacobi, consulte el ejercicio 17, y para el esquema de Gauss-Siedel, consulte 
[Or2], p. 120). 
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Teorema 7.21 


Teorema 7.22 


Si A es estrictamente diagonalmente dominante, entonces para cualquier selección de х0), 
tanto los métodos de Gauss-Siedel у de Jacobi dan sucesiones {х'®© }°° que convergen a la 
solución única de Ax = b. и 


La relación de Іа rapidez de convergencia рага el radio espectral de la matriz de itera- 
ción T se puede observar a partir del corolario 7.20. Las desigualdades se mantienen para 
cualquier norma matricial natural, por lo que sigue la declaración después del teorema 7.15 
en la página 332 que 


\х® x= (Т) |х) — х. (7.12) 


Рог lo tanto, nos gustaría seleccionar la técnica iterativa con p(T) < 1 mínima para un 
sistema particular Ax = b. No existen resultados generales para decir cuál de las dos téc- 
nicas, Jacobi о Gauss-Siedel, será más exitosa para cualquier sistema lineal arbitraria. En 
casos especiales, sin embargo, la respuesta es conocida, como se demuestra en el siguiente 
teorema. La prueba de este resultado se puede encontrar en [y], p. 120-127. 


(Stein-Rosenberg) 


51а; < 0, para cada i Æ j, y а > 0, para cada = 1, 2,..., п, entonces una y sólo una de 
las siguientes declaraciones es válida: 


i) 0< (Т) < р(Т) < 1; ii) 1=<0(7;) < о(Т,); 
iii) 0(7;) = p(T;) = 0; iv) о(7;) = р(Т,) = 1. a 


Para el caso especial descrito en el teorema 7.22, observamos, a partir de la parte 1), que 
cuando un método proporciona convergencia, entonces provee convergencia y el método de 
Gauss-Siedel converge más rápido que el método de Jacobi. La parte 11) indica que cuando 
un método diverge, entonces ambos divergen y la divergencia es más pronunciada para el 
método Gauss-Siedel. 


La sección Conjunto de ejercicios 7.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Definición 7.23 


La palabra “residual” significa 
lo que sobra, por lo que es un 
nombre adecuado para este 
vector. 


Técnicas de relajación para resolver sistemas lineales 


En la sección 7.3 observamos que la tasa de convergencia de una técnica iterativa depende 
del radio espectral de la matriz relacionada con el método. Una forma de seleccionar un pro- 
cedimiento para convergencia acelerada es seleccionar un método cuya matriz relacionada 
tiene un radio espectral mínimo. Antes de describir un procedimiento para seleccionar dicho 
método, necesitamos introducir medios nuevos para medir la cantidad por la que una apro- 
ximación a la solución de un sistema lineal difiere de la verdadera solución del sistema. El 
método utiliza el vector descrito en la siguiente definición. 


Suponga que X e R” es una aproximación a la solución del sistema lineal definido por Ax = b. 
El vector residual para X respecto a este sistema es r = b — АХ. п 


En procedimientos como los métodos de Jacobi o Gauss-Siedel un vector residual está 
relacionado con cada cálculo de un componente aproximado para el vector solución. El ver- 
dadero objetivo es generar una sucesión de aproximaciones que causarán que los vectores 
residuales converjan rápidamente a cero. Suponga que tenemos 

© _ (,(k) ,(k) (ЭБШ 
т = (лгу? ) 


li >*2i>*** > ni 
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denota el vector residual para el método Gauss-Siedel correspondiente al vector solución 
aproximado x® definido por 


(k) __ (k) (k) (К) (к—1) (k—1)\‘ 
X (xi Хо. ersa Д, экелу у). 


y 


El m-ésimo componente de г® е$ 


ї—1 п 
(k) (ko) „(k—1) 
Tmi = bm — > йт; — › amj j , (7.13) 
j= j=i 
o, de manera equivalente, 
1—1 п 
(C __ X \ (k) X | (k—1) (к—1) 
Fmi = bm — amjXj = AmjXj — Ami Xi Я 
j=1 j=i41 


рага cada m =1,2,...,n. 
E кын (k) 
En particular, el ¡-ésimo componente de г; es 


1—1 п 


(k) k „(k—1 (k—1 
Pi = i— ajx? – 5 QijX j ) — ayx! ) 


рог lo que 


= k k к—1 
điiXi + О = b; = У ajja, ) = 5 ах 1, (7.14) 


1 = 
Ea У ані. 05) 


por lo que la ecuación (7.14) se puede reescribir como 


(к—1) 


i 


(0 __ (k) 
Aj¡X Hri = анх. 
. . үн . . . [4 
Por consiguiente, el método Gauss-Siedel se puede caracterizar seleccionando E ) para sa- 
tisfacer 


х =D y Ta (7.16) 


Podemos derivar otra conexión entre los vectores residuales y la técnica de 
A | | k Е k k 
Gauss-Siedel. Considere el vector residual г! 6 asociado con el vector х\ | = х! Р 


хіб, а ‚.., XD)", Mediante la ecuación (7.13), el ¡-ésimo componente de г, es 


i n 


w 0) (4-1) 
ria =D aya — У а 


j=l j=i+1 


1—1 п 


k) k=1 k) 
= bi == ajja) = 5 ацх\ ) = анх * 


j=1 j=i+1 
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Solución para cada К = 1, 2,... , las ecuaciones para el método de Gauss-Siedel son 
0, 
xP = —075х® +0.25x%7 зу 
xP =0.25x® — 6, 
y las ecuaciones para el método SOR con @ = 1.25 son 
=P +7.5, 
x = —0.9375x® 005 0 + 9.375, 
х{® = 0.3125х® — 0.25x 7? — 7.5. 


Las primeras siete iteraciones para cada método se listan en las tablas 7.3 y 7.4. Рага que 
las iteraciones sean precisas para siete lugares decimales, el método de Gauss-Siedel requie- 


re 34 iteraciones, en comparación con las 14 del método SOR con о = 1.25. E 
Tabla 7.3 
k 0 1 2 3 4 5 6 T 
хб? 1 5.250000 3.1406250 3.0878906 3.0549316 3.0343323 3.0214577 3.0134110 
ЖӨ 1 3.812500 3.8828125 3.9267578 3.9542236 3.9713898 3.9821186 3.9888241 
xP 1 —5.046875 —5.0292969 —5.0183105 —5.0114441 —5.0071526 —5.0044703 —5.0027940 
Tabla 7.4 
k 0 1 2 3 4 5 6 7 
Ж 1 6.3125000 2.6223145 3.1333027 2.9570512 3.0037211 2.9963276 30000498 
x9 1 3.5195313 3.9585266 4.0102646 4.0074838 4.0029250 4.0009262 4.0002586 
xP 1 —6.6501465 —4.6004238 —5.0966863 —4.9734897 —5.0057135 —4.9982822 —5 0003486 


Теогета 7.24 


Теогета 7.25 


Теогета 7.26 


Una pregunta obvia es cómo se selecciona el valor adecuado de о cuando se usa el méto- 
do SOR. A pesar de que no se conoce una respuesta completa a esta pregunta para el sistema 
lineal n X n, los siguientes resultados se pueden utilizar en ciertas situaciones importantes. 


(Kahan) 


Si aj; + 0, para cada i = 1, 2,... , п, entonces о(Т„) > |œ — 1|. Esto implica que el 
método SOR puede converger sólo si 0 < w < 2. п 


La demostración de este teorema se considera еп el ejercicio 13. La de los siguientes dos 
resultados se puede encontrar en [Or2], р. 123-133. Estos resultados se usarán en el capítulo 12. 


(Ostrowski-Reich) 


Si A es una matriz definida positiva y 0 < о < 2 entonces el método SOR converge рага 
cualquier opción de vector aproximado inicial x®. п 


Si A es definida positiva y tridiagonal, entonces p(T) = [0(7,)р < 1, y la selección ópti- 
ma de w, para el método SOR es 
2 


w = . 
=[arar 


Con esta selección de w, tenemos о(Т„) = œ — 1. ш 
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Ejemplo 2 Encuentre la selección óptima de о, para el método SOR para la matriz 


4 з 0 
А=|3 4 -1 
0—1 4 


Solución Esta matriz es claramente triangular, por lo que podemos aplicar el resultado del 
teorema 7.26 si también podemos mostrar que es definida positiva. Puesto que la matriz es 
simétrica, el teorema 6.25 en la página 310 establece que es definida positiva si y sólo si 
todas sus primeras submatrices principales tienen determinantes positivos. Esto se observa 
fácilmente es este caso porque 


det(A) = 24, det (| А i )) = 7, y det ([4]) = 4. 


Puesto que 
¿00 0-30 0 -075 0 
T¡=D"U(L+U)= 0 І 0 —3 0 1|=|-075 0 0.25 |, 
0.0 п 0 1 0 0 0.25 0 
tenemos 
—À —0.75 0 
T;— ìl = | —0.75 —A 0.25 |, 
0 0.25 —A 
рог lo que 


det(T; — АГ) =—A(A? — 0.625). 
Por lo tanto, 


(Ту) = 10.625 


2 2 
ES де 1.24 
=P 14/1063 


Esto explica la rápida convergencia obtenida en el ejemplo 1 cuando se utiliza о = 1.25. ш 


Cerramos esta sección con el algoritmo 7.3 para el método SOR. 


SOR 


Para resolver Ax = b dado el parámetro w y una aproximación inicial x®: 


ENTRADA el número de ecuaciones y valores desconocidos n; las entradas а;;, 1 < i, j < п 
de la matriz A; las entradas b;, 1 < i < п, deb; las entradas ХО;, 1 < i < n, de XO = x0; 
el parámetro w; tolerancia TOL; el número máximo de iteraciones N. 


SALIDA la solución aproximada x;,..., х, о un mensaje que indique que se superó el 
número de iteraciones. 


Paso 1 Determine k = 1. 


Paso 2 Mientras (k < N) haga los pasos 3—6. 
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Paso 3 Рага і = 1,...,п 
determine х; = (1 — о) ХО;+ 
1 1—1 п 

в С (- Xj а} ху — isis а; ХО; + bi )| ; 

Paso 4 Si|lx — ХО|| < TOL entonces SALIDA (x1, ..., Xn); 
(El procedimiento fue exitoso.) 
PARE. 

Paso 5 Determine К = К + 1. 


Paso 6 Parai = 1,..., п determine ХО; = xi. 


Paso 7 SALIDA (“Número máximo de interacciones alcanzado”); 


(El procedimiento no fue exitoso.) 
PARE. п 


La sección Conjunto de ejercicios 7.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


PEN 7.5 Cotas de error y refinamiento iterativo 


Parece intuitivamente razonable que si X es una aproximación a la solución x de Ax = b y 
el vector residual г = b — AX tiene la propiedad de que ||r|| es pequeña, entonces ||x — X || 
también sería pequeña. A menudo, éste es el caso, pero ciertos sistemas, a menudo presentes 
en la práctica carecen de esta propiedad. 


Ejemplo 1 El sistema lineal Ах = b dado por 


Га 
1.0001 2 || x2 | | 3.0001 


tiene la solución única х = (1, 1). Determine el vector residual para la aproximación defi- 
ciente Š = (3, —0.0001)'. 


Solución Tenemos 


ls 3 E 1 2 3 _ [00002 
к= x= | 3.0001 1.0001 2 || —0.0001 | = 0 


por lo que [|г[|— = 0.0002. A pesar de que la norma del vector residual es pequeña, la apro- 
ximación X = (3, —0.0001)' es obviamente bastante deficiente; de hecho, |х — ||, = 2. ш 


La dificultad en el ejemplo 1 se explica con facilidad al observar que la solución del 
sistema representa la intersección de las rectas 


l: xi+2x=3 y h: 1.0001х + 2x2 = 3.0001. 


El punto (3, —0.0001) se encuentra en l2, y las rectas son casi paralelas. Esto implica 
que (3, —0.0001) también se encuentra cerca de /¡, aunque difiere significativamente de la 
solución del sistema, determinada por el punto de intersección (1, 1). (Consulte la figura 7.7.) 
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Figura 7.7 


Teorema 7.27 


Definición 7.28 


El ejemplo 1 se construyó claramente para mostrar las dificultades que pueden surgir, y 
de hecho, surgen. Si las rectas no coinciden por completo, esperaríamos que un vector resi- 
dual pequeño implique una aproximación precisa. 

En la situación general no podemos depender de la geometría del sistema para propor- 
cionar una indicación de cuándo pueden surgir los problemas. Sin embargo, podemos obte- 
ner esta información al considerar las normas de la matriz А y su inversa. 


Suponga que X es una aproximación a la solución de Ax = b, А es una matriz no singular y 
r es el vector residual para X. Entonces, para cualquier norma natural, 


Е =1 
|х — 1 < lirl] + 1141, 


ysix#0yb#0, 


[х — Х| КЧ 
А.А | (7.20) 


Demostración Puesto que r = b — АХ = Ах— AX y А es no singular, tenemos 
x — Š = A”!r.El corolario 7.10 en la página 326 implica que 


= -1 -1 
[х — XI] = 1А г| < [А [1 + llel]. 


Además, puesto que b = Ax, tenemos ||b|| < || A||- [|х||. Por lo que 1/[|x!| < [|| А /IIb]| y 


— ў . =l 
|х — Х| 2 ПАП - ПА | 
|х| | 


{г ||. m 


Números de condición 


Las desigualdades en el teorema 7.27 implican que || A7! || y 1411 - I| A7} || proveen una indi- 
cación de la conexión entre el vector residual y la precisión de la aproximación. En general 
el error relativo [||х—®||/||х|| es de mayor interés, y, mediante la desigualdad (7.20), este 
error está acotado por el producto de || A|| · 14 || con el residuo relativo de esta aproxima- 
ción, |1 | /|[® ||. Cualquier norma conveniente se puede usar para esta aproximación; el único 
requisito es que se use constantemente de principio a fin. 


El número de condición de la matriz no singular A relativo a la norma ||. || es 
-1 
К(А) = |A] -A7 |. a 
Con esta notación, las desigualdades en el teorema 7.27 se convierten en 


E lle 
|х – Х| < КСА) 
A] 


Ejemplo 2 
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[х — Х|| ||| 
E KA. 
\х|| | 


Para cualquier matriz А no singular y norma natural 


y 


1 = || = JA- AT < [141-147] = КСА). 


Una matriz A está bien condicionada si K (А) está cerca de 1 y está mal condicionada cuan- 
do К (A) es significativamente mayor que 1. El condicionamiento en este contexto se refiere 
a la seguridad relativa de que un vector residual pequeño implica una solución aproximada 
correspondientemente precisa. 


Determine el número de condición para la matriz 


1 2 
Же |а a 


Solución Еп el ejemplo 1 observamos que la misma aproximación deficiente (3, 
—0.0001) para la solución exacta (1, 1)” tenía un vector residual con norma pequeña, 
por lo que deberíamos esperar que el número de condición de A sea grande. Tenemos 
Allo = шах{|1| + |2|, 11.001 + |2|} = 3.0001, que no se podría considerar grande. Sin 
embargo, 


— 10000 10000 


=i 
ша 5000.5 —5000 j 


así |А llo. = 20000, 


y para la norma de infinidad, K (A) = (20000)(3.0001) = 60002. El tamaño del número de 
condición para este ejemplo debería evitar que tomáramos decisiones apresuradas con base 
en el residuo de una aproximación. п 

A pesar de que un número de condición de una matriz depende solamente de las normas de 
la matriz y su inversa, el cálculo de la inversa está sujeto a error de redondeo y depende 
de la precisión con la que se realizan los cálculos. Si las operaciones implican aritmética con t 
dígitos de precisión, el número de condición aproximada para la matriz A es la norma de la 
matriz multiplicada por la norma de la aproximación para la inversa de A, que se obtiene a 
través de aritmética de £ dígitos. De hecho, este número de condición también depende del 
método utilizado para calcular la inversa de A. Además, debido al número de cálculos nece- 
sarios para calcular la inversa, necesitamos ser capaces de calcular el número de condición 
sin determinar directamente la inversa. 

Si suponemos que la solución aproximada para el sistema lineal Ax = b se determina por 
medio de la aritmética de £ dígitos y la eliminación gaussiana, es posible mostrar (consulte 
[FM], p. 45-47) que el vector r para la aproximación X tiene 


pr] 107/41) - [[X 


. 


Il. (7.21) 


A partir de esta aproximación se puede obtener un cálculo para el número de condición 
efectivo en aritmética de £ dígitos sin necesidad de invertir la matriz A. En la actualidad esta 
aproximación supone que todas las operaciones aritméticas en la técnica de eliminación 
gaussiana se realizan usando la aritmética de £ dígitos, pero que las operaciones necesarias 
para determinar el residuo se realizan en aritmética de doble precisión (es decir, 2t dígitos). 
Esta técnica no se suma significativamente al esfuerzo computacional y elimina la mayor 
parte de la pérdida de precisión implicada con la resta de los números casi iguales que se 
presentan en el cálculo del residuo. 

La aproximación para el número de condición Ķ (A) con t dígitos proviene de la consi- 
deración del sistema lineal 


Ау = г. 
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Ilustración 


La solución para este sistema se puede aproximar fácilmente porque los multiplicadores para 
el método de eliminación gaussiana ya se han calculado. Por ello, A se puede factorizar de 
la forma P' LU, como se describe en la sección 5 del capítulo 6. De hecho, y, la solución 
aproximada de Ay = r, satisface 


ў А-г = А! – А) = А-Ы – А! А = x — $, (7.22) 


Xx =X+Y. 


Por lo que ў es un cálculo del error producido cuando X se aproxima а la solución х del sis- 
tema original. Las ecuaciones (7.21) y (7.22) implican que 


IÑI lx —x [1 = ПАТЕ < 1471 e = ПАТ АО А1 + 1) = 107" [XX (А). 


Esto nos da una aproximación para el número de condición que participa en la solución 
del sistema Ax = b usando eliminación gaussiana y el tipo de £ dígitos de la aritmética que 
acabamos de describir: 


INAl 


K(A) ж — 10. (7.23) 
Х| 
El sistema lineal dado por 
3.3330 15920  -—10.333 Х| 15913 
2.2220 16.710 9.6120 x2 | = | 28.544 
1.5611 5.1791 1.6852 X3 8.4254 


tiene la solución exacta x = (1, 1, 1). 
Mediante eliminación gaussiana y aritmética de redondeo de cinco dígitos conduce 
sucesivamente a las matrices aumentadas 


3.3330 15920 — 10.333 15913 
0 —10596 16.501 10580 
0 —7451.4 6.5250 —7444.9 
y 
3.3330 15920 —10.333 15913 
0 — 10596 16.501 —10580 
0 0 5.0790 —4.7000 


La solución aproximada para este sistema es 
Ж = (1.2001, 0.99991, 0.92538). 


El vector residual correspondiente a X se calcula con precisión doble como 


r = b — AX 
15913 3.3330 15920 —10.333 1.2001 
= | 28.544 | — | 2.2220 16.710 9.6120 0.99991 
8.4254 1.5611 5.1791 1.6852 0.92538 
15913 15913.00518 —0.00518 
= | 28.544 | — | 28.26987086 | = 0.27412914 


8.4254 8.611560367 —0.186160367 
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Por lo que 


Irl = 0.27413. 


El cálculo para el número de condición provisto en el análisis anterior se obtiene al 
resolver primero el sistema Ay = г para ў: 


3.3330 15920 —10.333 yı —0.00518 
2.2220 16.710 9.6120 y | = 0.27413 
1.5611 5.1791 1.6852 уз —0.18616 


Esto implica que ў = (—0.20008, 8.9987 х 107°, 0.074607)‘. Mediante el cálculo en la 
ecuación (7.23) da 


y 0.20008 
rasa Miles үй 


_ = 10° = 16672. (7.24) 
IXlloo 1.2001 


Para determinar el número de condición exacto de A, primero debemos encontrar A 1 Usan- 
do aritmética de cinco dígitos para los cálculos obtenemos la aproximación 


—1.1701 x 1074 —1.4983 x 107! 8.5416 x 107! 
Ав 6.2782 х 10-5 1.2124 х 1074 3.0662 х 1074 
—8.6631 х 107? 1.3846 х 107! —1.9689 х 107! 


El teorema 7.11 en la página 328 implica que 47! lla, = 1.0041 y [| Allo. = 15934. 
Como consecuencia, la matriz mal condicionada A tiene 


K(A) = (1.0041)(15934) = 15999. 


El cálculo en la ecuación (7.24) es bastante cercano a K (4) y requiere considerablemen- 
te menos esfuerzo computacional. 

Puesto que se conoce la solución real х = (1, 1, 1)' para este sistema, podemos calcular 
tanto 


E Ix—Xlloo 0.2001 
Ix — Xlloo = 0.2001 y = = 0.2001. 
|х| 1 


Las cotas de error dadas еп el teorema 7.27 para estos valores son 


11 _ (15999)(0.27413) 


– | < K(A = = 0.27525 
[х = Šlo < K( УТА 15052 
у 
— ï% 15 0.27413 
|х — ||. < К(А) |1 = (15999)( ) _ 0.27561. a 
|х| 10112 15913 
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Refinamiento iterativo 


En la ecuación (7.22) utilizamos el cálculo y ~ х — X, donde y es la solución aproximada 
para el sistema Ay = г. En general, X4-y es una aproximación más precisa del sistema lineal 
Ах = b que la original X. El método que usa esta suposición recibe el nombre de refina- 
miento iterativo, o mejora iterativa, y consiste en realizar iteraciones sobre el sistema cuyo 
lado derecho es el vector residual para aproximaciones sucesivas hasta obtener resultados 
precisos satisfactorios. 

Si se aplica el proceso mediante aritmética de г dígitos y si Ko(A) œ% 104, entonces 
después de k iteraciones de refinamiento iterativo, la solución tiene aproximadamente el 
dígito más pequeño de ѓу k(t — q) dígitos correctos. 51 el sistema está bien condicionado, 
una o dos iteraciones indicarán que la solución es precisa. Existe la posibilidad de mejora 
significativa en sistemas mal condicionados a menos que la matriz A también esté tan mal 
condicionada que Kẹ% (A) > 10". En esa situación, se usaría la precisión incrementada para 
los cálculos. El algoritmo 7.4 implementa el método de refinamiento iterativo. 


Refinamiento iterativo 


Para aproximar la solución del sistema lineal Ax = b: 


ENTRADA el número de ecuaciones y valores desconocidos n, las entradas 
aij, 1 < i, j < п de la matriz A; las entradas b;, 1 < i < n de b; el número máximo de 
iteraciones N; tolerancia TOL; número de dígitos de precisión t. 


SALIDA la aproximación xx = (xxi, ... , XXn) О un mensaje de que el número de itera- 
ciones fue excedido y una aproximación COND para Ko(4). 


Paso O  Resuelva el sistema Ax = b para x;,... , х, usando eliminación gaussiana al 
guardar los multiplicadores m ;,  =i+1,i1+2,...,n,i=1,2,...,n—1 
y observar los intercambios de fila. 


Paso 1 Determine k = 1. 
Paso 2 Mientras (К < N) haga los pasos 3—9. 
Paso 3 Parai=1,2,...,n (Calcule r.) 


n 
determine r; = b; — > йы Хы 
j=l 


(Realice los cálculos en aritmética de doble precisión .) 


Paso 4 Resuelva el sistema lineal Ay = r mediante eliminación gaussiana en 
el mismo orden que en el paso 0. 


Paso 5 Parai = 1,... ‚п determine xx; = х; + yi. 
Paso 6 Sik = 1 entonces determine COND = ly llos 10%. 
хх | 
Paso 7 Sillx — хх||„„ < TOL entonces SALIDA(xx); 
SALIDA ( COND), 
(El procedimiento fue exitoso.) 
PARE. 


Paso 8 Determine k = К + 1. 
Paso 9 Parai = 1,... ‚п determine x; = xxi. 


Paso 10 SALIDA (‘Número máximo de interacciones extedidas”); 
SALIDA (COND); 
(El procedimiento no fue exitoso.) 
PARE. E 


Ilustración 


Teorema 7.29 
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Si se utiliza aritmética de г dígitos, un procedimiento recomendado para interrumpir el 
proceso en el paso 7 es iterar hasta que |у®| < 107, рага cada i = 1, 2,..., п. 


En nuestra ilustración previa encontramos la aproximación para el sistema lineal 


3.3330 15920 —10.333 xı 15913 
2.2220 16.710 9.6120 х | = | 28.544 
1.5611 5.1791 1.6852 Хз 8.4254 


usando la aritmética de cinco dígitos y eliminación gaussiana es 
g™® = (1.2001, 0.99991, 0.92538)' 
y la solución para Ау = r” es 


ў = (—0.20008, 8.9987 х 107°, 0.074607)'. 


Por el paso 5 еп este algoritmo, 


z® = g™ 4 ў) = (1.0000, 1.0000, 0.99999)', 


y el error real en esta aproximación es 
х – 02| = 1 x 107. 


Usando la técnica para interrumpir el algoritmo, calculamos г) = b — АХО) y resolvemos 
el sistema Ау) = r®, que nos da 


ў® = (1.5002 x 107°, 2.0951 x 107!°, 1.0000 x 1075). 
Puesto que [$2 llo < 1075, concluimos que 
09) =x0 + 5% = (1.0000, 1.0000, 1.0000) 
es suficientemente preciso, lo cual es, sin duda alguna, correcto. ш 


A lo largo de esta sección, se ha supuesto que en el sistema lineal Ах = b, A y b se 
pueden representar de forma exacta. Siendo realistas, las entradas a;j y bj, se alterarían o 
perturbarían por una cantidad de 9a;; y ôb j, que causaría que el sistema lineal 


(А +8A)x = b + ôb 


se resolviera en lugar de Ах = b. Normalmente, si || A|| y ||8b || son pequeñas (en el orden de 
107), la aritmética de £ dígitos produce una solución X para la que ||х — X || es correspondien- 
temente pequeña. Sin embargo, en caso de sistemas mal condicionados, hemos observado 
que incluso si A y b se representan de manera exacta, los errores de redondeo pueden causar 
que ||x — X || sea grande. El siguiente teorema relaciona las perturbaciones del sistema lineal 
para el número de condición de una matriz. La prueba de este resultado se puede encontrar 
en [Or2], p. 33. 


Suponga que А es no singular y 


18 Al < == - 
A? 


La solución х para (A + дА) = b + ôb aproxima la solución х de Ax = b con el cálculo 
de error 


Ix- 4i KCAMNAN E e ка!) | (7.25) 


\х[ ПА = KA) SA А || [All 
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El cálculo en la desigualdad (7.25) establece que si la matriz A está bien condicionada 
(es decir, К (А) no es demasiado grande), entonces los cambios pequeños en A y b producen 
cambios proporcionalmente pequeños en la solución de x. Si, por otro lado, A está mal con- 
dicionada, entonces los cambios pequeños en A y b pueden producir cambios grandes en x. 

El teorema es independiente del procedimiento numérico particular que se usó para re- 
solver Ax = b. Se puede mostrar, mediante un análisis de error regresivo (consulte [Wil1] o 
[W112]), que si la eliminación gaussiana con pivoteo se usa para resolver Ах = b con aritmé- 


James Hardy Wilkinson (1919- tica de £ dígitos, la solución numérica X es la solución real de un sistema lineal, 


1986) es mejor conocido por su = dra (0 
amplio trabajo sobre métodos (А + 8А)х =b, donde [ISA ll. < f(n)10 max la;; |, 
numéricos para resolver с. 


ecuaciones lineales у ЯР СЫР", РЕС У, 
problemas de eigenvalor. para alguna función f(n). En la práctica, Wilkinson descubrió que f(n) = n y, en el peor de 


También desarrolló la técnica de los casos, que f (n) < 1.01 (n? + 3n?). 

análisis de error regresivo. 
La sección Conjunto de ejercicios 7.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


ж 7.6 El método de gradiente conjugado 


El método de gradiente conjugado de Hestenes y Stiefel [HS] se desarrolló originalmente 
como un método directo diseñado para resolver un sistema lineal n X n definido positivo. 
Como método directo, en general es inferior a la eliminación gaussiana con pivoteo. Ambos 
métodos requieren n pasos para determinar una solución y los pasos para el método de gra- 
diente conjugado son más costosos computacionalmente que los de la eliminación gaussiana. 


Magnus Hestenes (1906-1991) Sin embargo, el método de gradiente conjugado es útil cuando se usa como método de 
y Eduard Steifel (1907-1998) aproximación iterativa para resolver los sistemas dispersos grandes con entradas diferentes a 
publicaron el artículo original cero que se presentan en patrones predecibles. Con frecuencia estos problemas surgen en la 
sobre el método de gradiente E x Ё тыу 

н , solución de problemas de valores en la frontera. Cuando la matriz ha sido precondicionada 
conjugado en 1952 mientras А А ў j Я А . 
trabajaban en el Instituto para para realizar cálculos más eficientes, sólo se obtienen buenos resultados en aproximadamen- 


Análisis Numérico en el сатриѕ te y/n iteraciones. Empleado de esta manera, este método es preferible sobre la eliminación 
de la UCLA. gaussiana y los métodos iterativos analizados previamente. 
A lo largo de esta sección, suponemos que la matriz A es definida positiva. Usaremos la 
notación del producto interno 


(х,у) =X'y, (7.26) 


donde x y y son vectores n dimensionales. También necesitaremos algunos resultados es- 
tándar adicionales a partir del álgebra lineal. Una revisión de este material se encuentra en 
la sección 9.1. 

El siguiente resultado sigue fácilmente las propiedades de transposiciones (consulte el 
ejercicio 14). 


Teorema 7.30 Para cualquier vector x, y y > y cualquier número real о, tenemos 


a) (х,у) = (у, х); b) (ох,у) = (х, ау) = a (x, у); 
с) (х+2,у) = (х,у) + (2, у); d) (х, х) >20; 
е) (х, х) = 0 si у sólo si х = 0. и 


Cuando А es definida positiva, (х, Ах) = х'Ах > O а menos que х = 0. Además, 
puesto que А es simétrica, tenemos x‘ Ay = х' А'у = (Ax) y, рог lo que, además de los re- 
sultados en el teorema 7.30, tenemos, para cada x y y 


(x, Ay) = (Ax)'y = x' A'y = х' Ay = (Ах, y). (7.27) 


Teorema 7.31 
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El siguiente resultado es una herramienta básica en el desarrollo del método de gradiente 
conjugado. 


El vector x* es una solución para el sistema lineal definido positivo Ax = b si y sólo si x* 
produce el valor mínimo de 


g(x) = (x, Ax) — 2(x, b). 
Demostración Sean x y v Æ 0 vectores fijos y t una variable de número real. Tenemos 
g(x + tv) =(x + ty, Ax + t Av) — 2(х + ty, b) 
=(x, Ах) + (у, Ах) + t(x, Av) +12 (у, Av) — 2(x, b) — 2t (v, b) 
=(х, Ax) — 2(x, b) + 2t (v, Ax) — 2t (v, b) + t° (у, Av), 
por lo que 
gx + tY) = g(x) — 2t (v, b — Ax) + t° (v, Av). (7.28) 
Con x y v fijos podemos definir la función cuadrática h en t mediante 
h(t) = g(x + tv). 


Entonces л tiene un valor mínimo cuando h’(t) = 0 porque su coeficiente i (v, Av), es 
positivo. Puesto que 


h'(t) = —2(v,b — Ax) + 2t (v, Av), 


el mínimo se presenta cuando 


y, a partir de la ecuación (7.28) 


h(î) = g(x + іу) 
= g(x) — 2? (v, b — Ax) +? (у, Av) 
а (v, b — Ах) (v, b — Ax) Y? 
= g(x) 2 (у, Av) (v, b Ax) + (=) (v, Av) 


(v, b — Ax)? 
(v, Av) 


=g) — 


Así, para cualquier vector v -# 0, tenemos g(x + ?у) < g(x) a menos que (v, b — Ах) = 0, 
en cuyo caso g(x) = g(x + ?v). Éste es el resultado básico que necesitamos para probar el 
teorema 7.31. 

Suponga que x* satisface Ax* = b. Entonces (у, b— Ax*) = 0 para cualquier vector v y 
g(x) no se puede hacer más pequeño que g(x*). Рог lo tanto, x* minimiza g. 

Por otro lado, suponga que x* es un vector que minimiza g. Entonces, para cualquier 
vector v, tenemos g(x* + ?у) > g(x*). Por lo tanto, (у, b— Ах*) = 0. Esto implica que 
b — Ax* = 0 y, por consiguiente, que Ах“ = b. E 


Para comenzar el método gradiente conjugado seleccionamos x, una solución aproxima- 
da para Ax* = b y v Æ 0, lo cual nos da una dirección de búsqueda para alejarnos de x con 
el fin de mejorar la aproximación. Sea r = b — Ax el vector residual relacionado con x y 


(v, b — Ax) (У, г) 


(у, Av) (у, Ау) 
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Sir 4 0 y v y r no son ortogonales, entonces x + ѓу da un valor más pequeño para g que g(x) 
y es presumiblemente más cercano a x* que x. Esto sugiere el siguiente método. 
Si x® es una aproximación inicial para x* y si v Æ 0 es una dirección de búsqueda 
inicial. Para К =1,2,3,... , calculamos 
(v®, b— Ах) 
(y, Ау) 


х® = xD 4 ¿y0 


tg = 


y seleccionamos una dirección de búsqueda nueva у). El objetivo es realizar esta selec- 
ción de tal forma que la sucesión de aproximaciones {x } converja rápidamente a х“. 

Para seleccionar las direcciones de búsqueda, observamos g como una función de los 
componentes de х = (x1,x2,... , Xn)“. Por lo tanto, 


п п п 


&(х\, Ххә,... , Xn) = (X, Ax) — 2(х,р) = У Хаа — 2) xibi. 


і=1 ј=1 ¡=1 


Al tomar derivadas parciales respecto a las variables componentes x obtenemos 


98 
дхұ 


к) =2 У aixi — 25, 


ї=1 


que es el k-ésimo componente del vector 2(Ах — b). Por lo tanto, el gradiente de g es 
д д д ' 
Ув(х) = | Ew, mw...) = 2(Ах—Ь) =-2r, 
oxı 0x2 дхһ 


donde el vector г es el vector residual рага х. 

Del cálculo multivariable, sabemos que la dirección de mayor decrecimiento en el valor 
de g(x) es la dirección dada por —Vg(x), es decir, en la dirección del residuo r. El método 
que selecciona 


у) — r® = b — Ax% 


recibe el nombre de método de descenso rápido. A pesar de que observaremos en la sección 
10.4 que este método tiene mérito para problemas de sistemas no lineales y de optimización, 
no se usa para sistemas lineales debido a la lenta convergencia. 

Un enfoque alternativo utiliza un conjunto de vectores de dirección diferentes a cero 
{v®,... , v™®} que satisface 


(у, Av) =0, si 13 7. 


Esto se llama condición de ortogonalidad de A y se dice que el conjunto de los vectores 
{v®,... , v™®} es ortogonal a A. No es difícil mostrar que un conjunto de vectores ortogo- 
nales a A, asociados con la matriz definida positiva A, es linealmente independiente. (Con- 
sulte el ejercicio 15.) Este conjunto de direcciones de búsqueda da 


„n (убо, Ь – Ах 0) Е (у, к 10) 
КУ, Av®) (yO, Ay) 


ух® = x 0D дуб. 


El siguiente teorema muestra que esta selección de direcciones de búsqueda provee 
convergencia en la mayor parte de los n pasos, por lo que como método directo produce la 
solución exacta, al suponer que la aritmética es exacta. 
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Teorema 7.32 Sea(yÚ,... ,v™} un conjunto de vectores diferentes а cero ortogonal a A relacionados con 


(0) 


la matriz definida positiva A y sea x`” arbitrario. Defina 


(v®, b – Ах) 


(К) (к=) (k) 
k= (yO, Ау®) LACTEOS 
рага k = 1, 2,... ,n. Entonces, asumiendo la aritmética exacta, Ах” = b. 
Demostración Puesto que, para cada k =1,2,...,n, х'® = х) + дуб), tenemos 


Ах?) = Ах”) 4 £ Ау 


= (Ах"—7 + 4, AV OD) + t, Av 


= Ах + п AvP + MAYO + +, Av”. 
Al restar b de este resultado obtenemos 
Ах) —b=AxO — b + t Av + ›АУу? +--+ 1 Av”. 


Ahora tomamos el producto interno a ambos lados con el vector У y utilizamos las propie- 
dades de los productos internos y el hecho de que A es simétrica para obtener 


(AX — b, уй) = (4x0 — b, v®) +t (АУ, уб) e (АУ), yo) 
=(AXO — b, v®) +r (у), Av®) +... H (v, Ау). 
La propiedad de ortogonalidad de A provee, para cada k, 
(АХ) — b, уй) = (Ax® — b, уй) + д (у, Ayo). (7.29) 
Sin embargo, (у, Av®) = (v®, b — Ax =D), luego 
(У, Av®) = (уб, b — Ax® + Ax — Ах +... — AXE + Ax% — Ах) 
= (уб, b — Ах) + (уб, AxO — AxM)+ р (уб, Ax — Ax =D), 
Pero para cualquier i, 
х® = хй-0 ууф у AxO = Ах) GAO, 
рог lo que 
Ах“ — Ах@ = —г; Ау. 
Por lo tanto, 


A (уб, Ау) = (уб), b Ax0)) ti (уб), АУ?) A E (уб, Ау 1)). 


Puesto que la ortogonalidad de А (у®, Ауд) =0, рага cada і Æ k, entonces 


(1, Av jt = (у, b — Ах0)). 
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Ejemplo 1 


A partir de la ecuación (7.29), 
(Ах) — b, v®) = (AX O — b, уй) + (v®, b — Ax”) 
= (Ax — b, у) + (b – Ах, v®) 
= (Ах) — b, v®) — (Ах — b, v®) =0. 


Por lo tanto, el vector Ax™ —b es ortogonal al conjunto de vectores ortogonal de A 
(140)... ,v™®}. A partir de esto, sigue (consulte el ejercicio 15) que Ax” — b = 0, por lo 
que Ax” = b. н 


El sistema lineal 


4x1 + 3x2 = 24, 
3x1 +4x2— хз = 30, 
— х +4x3 = —24, 


tiene la solución exacta x* = (3, 4, —5)'. Muestre que el procedimiento descrito en el teore- 
ma 7.32 соп x® = (0, 0, 0)' produce esta solución exacta después de tres iteraciones. 


Solución En el ejemplo 2 de la sección 7.4 establecimos la matriz de coeficientes 


4 3 0 
А= |3 4 -I 
0 —1 4 


del sistema es definida positiva. Si v® = (1,0,0)',у® = (-3/4,1,0Y, у v® = 
(—3/7, 4/7, 1)!. Entonces 


4 3 -ż 
(уй, АУ?) = y MY py? = (1,0,0) | 3 4 —1 1 =0, 
0 — 0 
3 
4 3 =7 
(у ?, АУ?) = (1,0,0) | 3 4 —1 2 | =0, 
0 —1 1 
у 
a 4 3 -3 
wa, дн) = (71,0) з 4 —1 t| = 0: 
ы 0-1 4 1 


Рог lo tanto, {v® , vY%, у()} es un conjunto ortogonal de A. 
Al aplicar las iteraciones descritas en el teorema 7.22 para A con x® = (0,0,0) у 
b = (24, 30, —24) obtenemos 


r® =b — Ах = b = (24, 30, -24), 
por lo que 
y, rO) =y M0 =24, (y, Av®)=4, y = — = 6. 


Por lo tanto, 


х) =x0 + rov = (0,0,0) +6(1,0,0) = (6,0, 0). 


Teorema 7.33 
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Al continuar, tenemos 


rO =b- Ax® = (0,12, 24), аһ = (19 rD) = 12 _ 48 
ү І (УС), Avd) 7/4 i 


48 6 48 j 
х® =x” + пу? = (6,0,0) + 7 (-21 0) = (2.5 Р, 
120 (уб), r”) —120/7 _ 
@ =0— Ax® = | 0,0, – = = ==) 
į ( PET) PEO, АУЭ) 24/7 | 
у 
xO =x + һуб) = 6 48 0 en (—5) 23 4 1 | = (3,4 =5)' 
7° 9° 77 ‚4, . 
Puesto que aplicamos la técnica п = 3 veces, ésta debe ser la solución real. ш 


Antes de analizar cómo determinar el conjunto ortogonal a A, continuaremos con el de- 
sarrollo. El uso de un conjunto {у(),... , v™®} de vectores de dirección ortogonal a A provee 
lo que se conoce como método de dirección conjugada. El siguiente teorema muestra la 
ortogonalidad de los vectores residuales г“ у de los vectores de dirección У. Una prueba 
de este resultado mediante inducción matemática se considera en el ejercicio 16. 


Los vectores residuales г), donde k = 1, 2,... ,n, para un método de dirección conjugada, 
satisfacen las ecuaciones 


(г ©, y) =0, paracada j= 1,2,...,k. ш 


El método de gradiente conjugado de Hestenes y Stiefel selecciona las direcciones de 
búsqueda {у} durante el proceso iterativo de tal forma que los vectores residuales {1} 
son mutuamente ortogonales. Para construir los vectores de dirección {v®, v9,...) y las 
aproximaciones (x”,x9, ... }, iniciamos con una aproximación inicial x® y utilizamos 
la dirección descendente más pronunciada г = b— Ах como la primera dirección de 
búsqueda у 

Suponga que las direcciones conjugadas у(),... , у) y las aproximaciones х(!),..., 
x 1) se han calculado con 


х0 = xD y py 0, 
donde 
(19 Av) =0 y (O, r9)=0, раа i#j. 
Si xD es la solución para Ах = b, terminamos. De lo contrario, г) = b — Ах) 20, 


y el teorema 7.33 implica que (г =D, у) = 0, para cada i = 1,2,...,k— 1. 
Utilizamos г) para generar уб al hacer 


A p ggv D, 
Queremos seleccionar są—;ı de tal forma que 
Е АУ ®) = 0. 
Puesto que 


Ау( = Ар) + зр Ау) 


(vD, Av®) а с O у, 
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tendremos (у), AyW) = 0 cuando 


(yd, Аг) 
(у®—1), АУ®-—1)) ` 


Sk1 = 


También se puede mostrar que con esta selección de s;_¡, tenemos (у), Ау) = 0, para 
cada i = 1,2,... ,k — 2 (consulte [Lu], р. 245). Por lo tanto, {v®, ...vW) es un conjunto 


ortogonal a A. 
Al haber seleccionado у), calculamos 


па (10, 60) (06-0 + y ¡y 4D, 1—0) 
К yO, дуб) — (yO Ау) 
ED, г) (у 0, г 0) 


© WO, Ayo) ша! (yO, Ау®) 


Mediante el teorema 7.33, (у), r =D) = 0, por lo que 


(660, 66-0) 


Por lo tanto, 

х = xD дуб. 
Рага calcular г, multiplicamos A у restamos b para obtener 

Ах — b = Ах) + АУ 

o 

r® = réd — gay, 
Esto da 

г ®,г®) = wé, rO) (AY O ү®у = (г), Ayo), 
Además, a partir de la ecuación (7.30) 
(г®-9,г®-0у = (уб, Av®), 
por lo que 
е (уб, Ar) _ (г, Ау) _ A/tor®, ro) _ (г®, г®) | 
(YO, Ayo) (YO, Ау) (1/2) (ré), =D) (86-0, ré-0) 


En resumen, tenemos 
r® =b- Ax®; v® =r®; 


yparak=1,2,...,n, 


éD, г®—1)) 


к= A A A O sy = 


у) =p y sy, 


(7.30) 


(г, po) 
(у®, Ayo) (7-10, r&-D) i 


(1.31) 


El precondicioamiento reemplaza 
un sistema determinado por uno 
que tiene las mismas soluciones, 
pero con mejores características 
de convergencia. 
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Precondicionamiento 


En lugar de presentar un algoritmo para el método de gradiente conjugado mediante estas 
fórmulas ampliamos el método para incluir precondicionamiento. Si la matriz A está mal 
condicionada, el método de gradiente conjugado es altamente susceptible a errores de re- 
dondeo. Por lo tanto, a pesar de que se obtendría la respuesta exacta en los n pasos, normal- 
mente, éste no es el caso. Como método directo, el método de gradiente conjugado no es tan 
bueno como la eliminación gaussiana con pivoteo. El uso principal del método de gradiente 
conjugado es un método iterativo aplicado a un sistema mejor condicionado. En este caso, 
con frecuencia se obtiene una solución aproximada aceptable alrededor de /n pasos. 

Cuando se usa precondicionamiento, el método de gradiente conjugado no se aplica 
directamente a la matriz A, sino a otra matriz definida positiva que tiene un número de con- 
dición más pequeño. Necesitamos hacer esto de tal forma que una vez que se encuentra la 
solución de este sistema, será fácil obtener la solución para el sistema original. La expectati- 
va es que esto reducirá el error de redondeo al aplicar el método. Para mantener la definición 
positiva de la matriz resultante, necesitamos multiplicar en cada lado por una matriz no 
singular. Denotaremos esta matriz mediante С! y consideraremos 


A=C AC, 


con la esperanza de que Á tenga un número de condición menor que A. Para simplificar 
la notación, utilizamos notación de matriz C™ = (С е1 Más adelante en esta sección, 
observaremos una forma razonable de seleccionar C, pero primero consideraremos el méto- 
do de gradiente conjugado aplicado a А. 

Considere el sistema lineal 


donde Š = C'x yb = СЬ. Entonces, 
Ак = (C7! AC™')(C'x) = C7! Ах. 


Рог lo tanto, podemos resolver AX = Б para X y, después, obtener x al multiplicar por C™. 
Sin embargo, en lugar de reescribir la ecuación (7.31) mediante FW, #0, 7,, 0 y 3z, inclui- 
mos implícitamente la precondición. 

Puesto que 


#0 = С'х®, 


tenemos 
TO = b — AM SO by (САС С С вА) С, 
Si #0 = С'у® y w® = С! , Entonces 


(O, FO) (O Car) 


k= (FUI), #00) = (С—!т®—0,С-1г®—1)' 
por lo que 
А me, w®) (7.32) 
E yd йу: | 
Por lo tanto, 
(#60, #00) (С-!т®-0,б-1ү%-1) (е0, 0) 


k=- 0 AGO) (СУЮ, СТАС CNO) — (CIO, CTA) 


362 CAPÍTULO 7 = Técnicas iterativas en álgebra de matrices 
y puesto que 


A — A ALS) 
(CY, С Ау) = [Су |С Ау 


= [у ©! cc Ayo = [vr Ayo = (уб), Аүб)), 


tenemos 
ї, = {жн (7.33) 
(у ®, Дуб) 
Además 
#0 = 0-0 р, entonces С'х = С'х®-! y Cc tyo 
y 
х® xD дуб, (7.34) 
Al continuar, 
rO =p 7,490, 
por lo tanto 
С-!т® = Cred СПАС 009, г =r -RACC NO, 
y 
r® =r dD RAVO, (7.35) 
Finalmente, 
pu = #® + O y С'у+) = CAYO + GC, 
por lo que 
vD = CACA руб = CARO Y, (7.36) 


El método gradiente conjugado precondicionado está basado en el uso de las ecuaciones 
(7.32) a (7.36) en orden (7.33), (7.34), (7.35), (7.32) y (7.36). El algoritmo 7.5 implementa 
este procedimiento. 


Método de gradiente conjugado precondicionado 


Para resolver Ах = b dada la matriz precondicionada C7! y la aproximación inicial x®: 


ENTRADA el número de ecuaciones y valores desconocidos n; las entradas в, 
l<ijs<n de la matriz A; las entradas b;,1 < j < п del vector b; las entradas 
Уур. 1 < i, j < n de la matriz precondicionada С-!, las entradas х;,1 < i < n de la aproxi- 
mación inicial х = x® , el número máximo de iteraciones N; la tolerancia TOL. 


SALIDA la solución aproximada хі,...х, y el residuo г1,...ғ, o un mensaje de que se 
excedió el número de iteraciones. 


Paso 1 Determine r = b — Ах; (Calcule r®) 
w = Cr; (Nota: w = w®) 
v = C™w; (Nota: у = у) 
a = ууз. 


Paso 2 Determine k = 1. 


Paso 3 Mientras (k < N) haga los pasos 4—7. 
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Paso З Mientras (k < N) haga los pasos 4—7. 


Paso 4 бї|у|| < TOL, entonces 
SALIDA (Vector solución”; X],... , Xn); 
SALIDA (“Con residual”; гу, ..., Fn); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 5 Determine u = Av; (Vota: u = Ау) 


[= ; (Nota: t = tx) 


а 
= 
У j=1 иј 
x = х + ѓу; (Nota: x = х0) 

г = г — tu; (Nota: r = г) 

w = С Ir; (Nota: w = w®) 

f= ja ws. (Nota: В = (w%,wW)) 


Paso 6 Si|B| < TOL entonces 
si ||г|| < TOL entonces 
SALIDA (“Vector solución”; X],... , Xp); 
SALIDA (“con residuo”; r1, ... , Fn); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 7 Determine s = В/о; (5 = 5) 
v = C™w + sv; (Nota: v = v«+D) 
а = В; (Actualice о.) 
К= К+ 1. 


Paso 8 81 (К > п) entonces 
SALIDA (‘Se excedió el máximo número de iteraciones”); 
(El procedimiento no fue exitoso.) 
PARE. ш 


El siguiente ejemplo ilustra los cálculos рага un problema elemental. 


Ejemplo 2 El sistema lineal Ax = b dado por 


4x1 + 3x2 = 24, 
3x1 + 4x2 — хз = 30, 
— X + 4x3 = —24 


tiene solución (3, 4, —5)'. Utilice el método de gradiente conjugado con x®™ = (0,0,0y y 
sin precondicionamiento, es decir, con C = C “LST, para aproximar la solución. 


Solución La solución se consideró en el ejemplo 2 de la sección 7.4 donde el método SOR 
se utilizó con un valor casi óptimo de w = 1.25. 
Para el método de gradiente conjugado iniciamos con 


rO = b — Ax® = b = (24, 30, —24)'; 
w = С = (24, 30, -24)'; 

v® = Сэ = (24, 30, —24)'; 
а = (w, w) = 2052. 
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Iniciamos con la primera iteración con k = 1. Entonces, 


u = Ау!) = (186.0, 216.0, —126.0); 


= ) = 0.1469072165; 


(у), а 
х0 = х0 + пуй = (3.525773196, 4.407216495, —3.525773196)'; 
r® = r® — пи = (-3.32474227, –1.73195876, —5.48969072)'; 
к= Сет; 
В = (w, w) = 44.19029651; 


Si = В = 0.02153523222; 
а 


v® = C™w + sıv? = (-2.807896697, —1.085901793, —6.006536293)'. 


Establezca 


о = В = 44.19029651. 


Para la segunda iteración, tenemos 


u = Av? = (-14.48929217, —6.760760967, —22.94024338)'; 
h = 0.2378157558; 
x® = (2.858011121, 4.148971939, —4.954222164)'; 
г) = (0.121039698, —0.124143281, —0.034139402)'; 
у= С 100 = го); 
В = 0.03122766148; 
52 = 0.0007066633163; 
уб) = (0.1190554504, —0.1249106480, —0.03838400086)'. 
Determina о = В = 0.03122766148. 


La tercera iteración da 


u = Ау?) = (0.1014898976, —0.1040922099, —0.0286253554)'; 
tz = 1.192628008; 

x® = (2.999999998, 4.000000002, —4.999999998)'; 

г) = (0.36 х 107%, 0.39 x 1078, —0.141 х 1079). 


Puesto que x* es aproximadamente la solución exacta, el error de redondeo no afecta sig- 
nificativamente el resultado. En el ejemplo 2 de la sección 7.4, el método SOR con w = 1.25 
requería 14 iteraciones para una precisión de 1077. Sin embargo, se debería observar, en este 
ejemplo que en verdad estamos comparando un método directo para métodos iterativos. п 


El siguiente ejemplo ilustra el efecto del precondicionamiento en una matriz pobremente 
condicionada. En este ejemplo, usamos D7!/? para representar la matriz diagonal cuyas en- 
tradas son los recíprocos de las raíces cuadradas de las entradas de la diagonal de la matriz A 
de coeficientes. Ésto se utiliza como precondicionador. Puesto que la matriz A es definida 
positiva, esperamos que los eigevalores de D7!/? AD”*?? estén cerca de 1 con el resultado de 
que el número de condición de esta matriz sería relativamente pequeño para el número 
de condición de A. 


Ejemplo 3 


Ilustración 
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Encuentre los eigenvalores y número de condición de la matriz 


0.2 0.1 1 1 0 

0.1 4 =1 1 =] 
A=| 1 =1 60 0 -=2 

1 1 0 8 4 

0 -1 =2 4 700 


y compárelos con los eigenvalores y números de condición de la matriz precondicionada 
р-!?ХАр-!. 


Solución Рага determinar la matriz precondicionada, primero necesitamos la matriz diago- 
nal, la cual, al ser simétrica también es su transpuesta. Sus entradas diagonales se especifican 
mediante 


1 1 1 1 1 
al = —T—;a2= ; аЗ = ; аА = —; а5 = , 
v0.2 v4.0 60.0 V8.0 М 700.0 
y la matriz de precondicionamiento es 
2.23607 0 0 0 0 
0 .500000 0 0 0 
c! = 0 0 ‚129099 0 0 
0 0 0 .353553 0 
0 0 0 0 0.0377965 
La matriz precondicionada es 
A=CAC+* 
1.000002 0.1118035 0.2886744 0.7905693 0 
0.1118035 1 —0.0645495 0.1767765 —0.0188983 
= |0.2886744 —0.0645495 0.9999931 0 —0.00975898 
0.7905693 0.1767765 0 0.9999964 0.05345219 
0 —0.0188983 —0.00975898 0.05345219 1.000005 


Se encuentra que los eigenvalores de A у А son 


Eigenvalores de A 700.031, 60.0284, 0.0570747, 8.33845, 3.74533 y 
Eigenvalores de А 1.88052, 0.156370, 0.852686, 1.10159, 1.00884. 


Los números de condición de A y А con la norma / que se encuentran son 13961.7 para A y 
16.1155 para А. Sin duda alguna, es verdad que en este caso А está mejor condicionada que 
la matriz original A. a 


El sistema Ax = b con 


0.2 0.1 1 1 0 1 
0.1 4 =] 1 =l] 2 
A=| 1 —1 60 0 —2 y = | 3 
1 1 0 8 4 4 
0 —1 =2 4 700 5 


tiene la solución 


х* = (7.859713071, 0.4229264082, —0.07359223906, —0.5406430164, 0.01062616286)'. 
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La tabla 7.5 muestra los resultados obtenidos al utilizar los métodos iterativos de Jacobi, 
Gauss-Siedel y SOR (con w = 1.25) para el sistema con A con una tolerancia de 0.01, así 
como aquellos cuando el método de gradiente conjugado se aplica tanto en su forma no 
precondicionada como mediante la matriz de precondicionamiento descrita en el ejemplo 3. 
El método de gradiente conjugado no sólo provee las aproximaciones más precisas, sino que 


también utiliza un número más pequeño de iteraciones. п 
Tabla 7.5 
Número de 

Método iteraciones хб х* — x® llo 

Jacobi 49 (7.86277141,0.42320802, —0.07348669, 0.00305834 
—0.53975964, 0.01062847)' 

Gauss-Seidel 15 (7.83525748, 0.42257868, —0.07319124, 0.02445559 
—0.53753055, 0.01060903)' 

SOR (о = 1.25) 7 (7.85152706, 0.42277371, —0.07348303, 0.008 18607 
—0.53978369, 0.01062286)' 

Gradiente conjugado 5 (7.85341523, 0.42298677, —0.07347963, 0.00629785 
—0.53987920, 0.008628916)' 

Gradiente conjugado 4 (7.85968827, 0.42288329, —0.07359878, 0.00009312 


(precondicionado) 


—0.54063200, 0.01064344)' 


A menudo, el método de gradiente conjugado precondicionado se utiliza en la solución 
de los grandes sistemas lineales en los que la matriz está dispersa y es definida positiva. 
Estos sistemas se deben resolver para soluciones aproximadas para problemas de valores 
en la frontera de ecuaciones diferenciales ordinarias (secciones 11.3, 11.4 y 11.5). Mientras 
más grande sea el sistema, más prometedor será el método de gradiente conjugado porque 
reduce significativamente el número de iteraciones requeridas. En estos sistemas, la matriz 
precondicionada С es aproximadamente igual а L en la factorización de Cholesky LL* de 
A. En general, las entradas pequeñas en A son ignoradas y el método de Cholesky se aplica 
para obtener lo que recibe el nombre de una factorización Г.Г’ incompleta de A. Por lo tanto, 
CCA! А-1, y se obtiene una buena aproximación. Más información sobre el método 
de gradiente conjugado se puede encontrar en [Kelley]. 


La sección Conjunto de ejercicios 7.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


NY 7.7 Software numérico 


Aleksei Nikolaevich Krylov 
(1863-1945) trabajó en 
matemáticas aplicadas, 
principalmente en las áreas 

de problemas de valores en la 
frontera, la aceleración de la 
convergencia de series de Fourier 
y varios problemas clásicos 
relacionados con sistemas 
mecánicos. Durante principios 
de la década de 1930 fue el 
director del Instituto de Física- 
Matemáticas de la Academia 
Soviética de Ciencias. 


Casi todos los paquetes comerciales y de dominio público que contienen métodos iterativos 
para la solución de un sistema de ecuaciones lineales requieren el uso de un precondicionador 
con el método. A menudo, la rápida convergencia de los solucionadores se logra al utilizar 
un precondicionador. Un precondicionador produce un sistema equivalente de ecuaciones 
que, con suerte, presenta mejores características de convergencia que el sistema original. La 
Biblioteca IMSL tiene un método de gradiente conjugado precondicionado y la Biblioteca 
NAG tiene varias subrutinas, que son prefijos, para la solución iterativa de sistemas lineales. 

Todas las subrutinas están basadas en subespacios de Krylov. Saad [Sa2] tiene una 
descripción detallada de los métodos de subespacios Krylov. Los paquetes LINPACK y 
LAPACK sólo contienen métodos directos para la solución de sistemas lineales; sin em- 
bargo, los paquetes contienen muchas subrutinas que se utilizan mediante solucionadores 
Iterativos. Los paquetes de dominio público ІМІ ++, ІТРАСК, SLAP y Templates contienen 
métodos iterativos. MATLAB contiene varios métodos iterativos que también están basados 
en subespacios Krylov. 
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Los conceptos de número de condición y matrices pobremente condicionadas se intro- 
dujeron en la sección 7.5. Muchas de las subrutinas para resolver un sistema lineal o para 
factorizar una matriz en una factorización LU incluyendo verificaciones para matrices mal 
condicionadas, y también proporcionan un cálculo del número de condición. LAPACK tiene 
numerosas rutinas que incluyen el cálculo de un número de condición, como lo hacen las 
bibliotecas ISML y NAG. 

Las bibliotecas LAPACK, LINPACK, IMSL y NAG tienen subrutinas que mejoran una 
solución para un sistema lineal que está pobremente condicionado. La subrutina prueba el 
número de condición y, después, utiliza el refinamiento iterativo para obtener la solución 
más precisa posible dada la precisión de la computadora. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Teoría de aproximación 


Introducción 


La ley de Hooke establece que cuando se aplica una fuerza a un resorte construido con mate- 
rial uniforme, la longitud del resorte es una función lineal de esa fuerza. Podemos escribir la 
función lineal como F (1) = k(l — E), donde F (1) representa la fuerza requerida para estirar 
el resorte / unidades, la constante E representa la longitud del resorte sin fuerza aplicada у la 
constante k es la constante del resorte. 


lA 


14 + 
12 + id 
10 + с 
8 + 
е 
е 
k(l — Е) = FU) Ф 
2 + 
A 
2 4 6 F 


Suponga que queremos determinar la constante para un resorte que tiene una longitud ini- 
cial de 5.3 pulgadas. Aplicamos fuerzas de 2, 4 y 6 libras al resorte y encontramos que su lon- 
gitud aumenta a 7.0, 9.4 y 12.3 pulgadas, respectivamente. Una revisión rápida muestra que los 
puntos (0, 5.3), (2, 7.0), (4, 9.4) y (6, 12.3) no se encuentran completamente en línea recta. Aun- 
que podríamos usar un par aleatorio de estos puntos de datos para aproximar la constante del 
resorte, parecería más razonable encontrar la recta que mejor aproxima a todos los puntos de 
datos para determinar la constante. En este capítulo se considerará este tipo de aproximación y 
es posible encontrar esta aplicación de resorte en el ejercicio 7 de la sección 8.1. 

La teoría de la aproximación implica dos tipos generales de problemas. Uno surge cuan- 
do una función se define de manera explícita, pero nos gustaría encontrar un tipo de función 
“más simple”, como un polinomio, para los valores aproximados de una función determina- 
da. El otro problema se preocupa por ajustar funciones a un dato establecido y encontrar la 
“mejor” función de cierta clase para representar los datos. 

Ambos problemas se han analizado en el capítulo 3. El enésimo polinomio de Taylor 
alrededor del número xo es una excelente aproximación para una función f (n + 1) veces di- 
ferenciable en una vecindad de хо. Los polinomios de interpolación de Lagrange o, de modo 
más general, osculantes, se analizaron como polinomios de interpolación y para ajustar cier- 
tos datos. Los splines cúbicos también se analizaron en el capítulo 3. En este capítulo, se 
consideran las limitaciones para estas técnicas y se analizan otras vías de enfoque. 
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NTF 8.1 Aproximación por mínimos cuadrados discretos 


Considere el problema de calcular los valores de una función en puntos no tabulados, dados 

Tabla 8.1 los datos experimentales en la tabla 8.1. 
La figura 8.1 muestra una gráfica de los valores de la tabla 8.1. A partir de esta gráfica, 
parece que la relación real entre x y y es lineal. La razón probable para que ninguna línea se 


Xi Yi Xi Yi 


1 13 6 88 ajuste con precisión a los datos son los errores en estos últimos. Por lo que es poco razonable 
2 35 7 101 solicitar que la función de aproximación concuerde exactamente con los datos. De hecho, 
3o ga 8 125 dicha función introduciría oscilaciones que no estaban presentes originalmente. Por ejemplo, 
ез0 2 0 la gráfica del polinomio de interpolación de noveno grado que se muestra de modo libre para 
5 70 10 156 
los datos en la tabla 8.1 se muestra en la figura 8.2. 
Figura 8.1 
La gráfica obtenida (con puntos de datos adicionales) se muestra en la figura 8.2. 
Figura 8.2 


Este polinomio es claramente una predicción de la información entre una serie de puntos 
de datos. Un mejor enfoque sería encontrar la recta que se aproxima “mejor” (en cierto sen- 
tido), incluso si no concuerda precisamente con los datos en ningún punto. 


8.1 Aproximación por mínimos cuadrados discretos 371 


Sea que aix; + ay denota el ¡-ésimo valor en la recta de aproximación y que y, es el 
¡-ésimo valor de у dado. Suponemos que las variables independientes, las x;, son exactas; son 
las variables dependientes, las у;, de las que sospechamos. Esto es una suposición razonable 
en muchas situaciones experimentales. 

El problema de encontrar la ecuación de la mejor aproximación lineal en el sentido 
absoluto requiere encontrar los valores ay y a, para minimizar 


Es (ao, a1) = ¡máx (ly: — (aixi + ао)|}. 


Normalmente esto recibe el nombre de problema minimáx y no es posible manejarlo con 
técnicas fundamentales. 

Otro enfoque para determinar la mejor aproximación lineal implica encontrar los valores 
de ay y a, para minimizar 


10 
E¡ (ay, aj) = Jo ly; = (ах + ао)|. 


i=l 


Esta cantidad recibe el nombre de desviación absoluta. Para minimizar una función de dos 
variables, necesitamos igualar sus derivadas parciales a cero y resolver simultáneamente las 
ecuaciones resultantes. Еп el caso de la desviación absoluta, necesitamos encontrar ay y а con 


10 10 


д 
Уу — (a1x; + 00)| y 0 = з 2204 (ах + a)l. 


i=1 і=1 


д 
0 = — 
дао 
El problema es que la función valor absoluto no es diferenciable en сего y podríamos по 
encontrar soluciones para este par de ecuaciones. 


Mínimos cuadrados lineales 


El enfoque de mínimos cuadrados para este problema implica determinar la mejor línea 
de aproximación cuando el error relacionado es la suma de los cuadrados de las diferencias 
entre los valores y en la línea de aproximación y los valores y proporcionados. Por lo tanto, 
deben encontrarse las constantes ay y a; que minimizan el error de mínimos cuadrados: 


10 
Е»(ао, ај) = 5 [эг = (ах + ap. 


ї=1 


El método de mínimos cuadrados es el procedimiento más conveniente para determinar 
mejores aproximaciones lineales, pero también hay consideraciones teóricas importantes 
que lo favorecen. En general, mientras el enfoque minimáx asigna demasiado peso a un bit 
de datos con un gran error, el método de desviación absoluta no da suficiente peso a un punto 
que está fuera de la línea con la aproximación. El enfoque de mínimos cuadrados asigna con- 
siderablemente más peso en un punto que está fuera de la línea que al resto de los datos, pero 
no permitirá que el punto domine por completo la aproximación. Una razón adicional para 
considerar el enfoque de mínimos cuadrados implica el estudio de la distribución estadística 
del error (consulte [Lar], p. 463-481). 

El problema general de ajustar la mejor línea de mínimos cuadrados para una recopila- 


ción de datos {(x;, y;))7_, implica minimizar el error total, 


m 


E = Esfao, a1) = Y [yi — (ах; + а), 


i=1 


372 CAPÍTULO 8 


La palabra “normal” como 

aquí se usa implica la idea 

de “perpendicular”. Las 
ecuaciones normales se obtienen 
encontrando direcciones 
perpendiculares para una 
superficie multidimensional. 


Ejemplo 1 


Tabla 8.2 


= Teoría de aproximación 


respecto a los parámetros ay y ај. Para que se presente un mínimo, necesitamos que 


es decir, 
9 т 
0 = Jan 
a i 
y 
9 т 
0 = — 
дау * 


1 


[yi 
=1 


дЕ 
ponasa) 
дао 


3E _ 


— = 0, 
da] 


і=1 


і=1 


Estas ecuaciones se simplifican en las ecuaciones normales: 


m m m m 

2 

ao :т+а У x=% Yi y ao У х +а У Xi 
i=l i=1 ¡=1 ¡=1 


La solución para este sistema de ecuaciones es 


Encuentre la línea de mínimos cuadrados que se aproxima a los datos en la tabla 8.1. 


dy = 


m 


m m m 
2 a ` ` 
; Xi > JiS > Ху Xi 

i=l i=l і=1 і=1 


[Or = (аах — а) = 2 У 01 — axi — ао)(—1) 


— (ax; + ap)? = 2 Yo = ах; — Ay Xi). 


m 


= Улу. 
і=1 


(8.1) 


(8.2) 


Solución Primero ampliamos Іа tabla para incluir х2 у хуу; у sumamos las columnas. Esto 


se muestra en la tabla 8.2. 


Xi Yi x? х;у; Р(х) = 1.538х; — 0.360 
1 1.3 1 1.3 1.18 
2 3:5 4 7.0 2:12 
3 42 9 12.6 4.25 
4 5.0 16 20.0 5.79 
5 7.0 25 35.0 133 
6 8.8 36 52.8 8.87 
T 10.1 49 70.7 10.41 
8 12.5 64 100.0 11.94 
9 13.0 81 1170 13.48 
10 15.6 100 156.0 15.02 
55 810 385 5724 E =F! (у — Р(х))? ^4 2.34 


Figura 8.3 
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Las ecuaciones normales (8.1) y (8.2) implican que 


385 — З 
Е (81) — 55(572.4) — 0.360 
10(385) — (55)? 


_ 10(572.4) — 55(81) — 1.538. 
10(385) — (55)? 


а] 


por Іо que Р(х) = 1.538х — 0.360. La gráfica de esta recta y los puntos de datos se mues- 
tran en la figura 8.3. Los valores aproximados obtenidos por la técnica de mínimos cuadra- 
dos en los puntos de datos están en la tabla 8.2. ш 


у = 1.538х — 0.360 


Mínimos cuadrados polinomiales 


El problema general de aproximar un conjunto de datos { (x;, у) | i =1,2,...,m), con 
un polinomio algebraico 


P (x) = anx” + ap 1x7 +- + aix + ao, 
de gradon < m — 1, por medio del procedimiento de mínimos cuadrados se maneja de for- 


ma similar. Seleccionamos las constantes ао, 41, ..., а, para minimizar el error de mínimos 
cuadrados Е = E»(ap, aj,..., an), donde 


Е = У y — Pala Y 


i=1 


= Y y? -2 Y Рош» + YOPE) 
i=1 і=1 il 
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т т п т п 
2 
= > y, — 2) › ajx? yi + ajx? 
і=1 і=1 j=0 i=l j=0 
m n т п п т 
2 j j+k 
= › y, — 2) a; у yix; | + › aja; › х; 
i=] j=0 =1 j=0 k=0 i=l 
Como en el caso lineal, para minimizar Е es necesario que дЕ /да; = 0, para cada 
j=0,1,...,n. Por lo tanto, para cada j, debemos tener 
3E m 7 п т E 
0=>,,=-2) yix] +2) а У хі 
sx ¡=1 k=0 i=l 
Esto nos da n + 1 ecuaciones normales en las п + 1 incógnitas aj. Éstas son 
n т т 
j+k j А 
а > xp = › ух}, рагасайаў=0,1,...,п. (8.3) 
k=0 ial i=l 


Es útil escribir las ecuaciones de acuerdo con lo siguiente: 
т т т т т 
0 1 2 0 
ао > xi +a у х; + а у х + Фа, > x= › YiX;, 
і=1 i=l i=l і=1 i=l 


т 


т т т т 

1 2 3 „n+l __ 1 

ao У хі +a1 У х? + а У х + +4. У Xi =} УХ, 
i=1 і=1 i=l i=1 


i=1 


m m 


m m m 

„п n+1 n+2 2n __ „п 

а У х +а У Xi + а У Xi Hetan У xX = У УХ. 
i=1 i=1 i=1 i=1 i=1 


Estas ecuaciones normales tienen una única solución siempre y cuando las x; sean dis- 
tintas (consulte el ejercicio 14). 


Ejemplo 2 Ajuste los datos en la tabla 8.3 con el polinomio de mínimos cuadrados discretos de grado 


Tabla 8.3 


л & оо цо ra. 


1.00 27183 


máximo 2. 
Solución Рага este problema, п = 2, m = 5, y las tres ecuaciones normales son 
Yi 
1.0000 5ао + 2.541 + 1.875a2 = 8.7680, 
0.25 1.2840 2.549 + 1.875a1 + 1.56250 = 5.4514, y 
0.50 1.6487 1.8754, + 1.56254; + 1.38284 = 4.4015 
0.75 2.1170 ` ` j ` ` 


Al resolver las ecuaciones obtenemos 
ао = 1.005075519, а, = 0.8646758482, у a = 0.8431641518. 


Рог lo tanto, el polinomio de mínimos cuadrados de grado 2 que se ajusta a los datos de 
la tabla 8.3 es 


Р›(х) = 1.0051 + 0.86468х + 0.84316x?, 


cuya gráfica se muestra en la figura 8.4. En los valores determinados de x;, tenemos las apro- 
ximaciones mostradas en la tabla 8.4. 
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Figura 8.4 
y = 1.0051 + 0.86468x + 0.84316x? 
El error total, 
5 
Е = У (у; – Pi)? = 274 x 107%, 
і=1 
es el mínimo que se puede obtener а través de un polinomio de grado máximo 2. п 
Tabla 8.4 i 1 2 3 4 5 
Xi 0 0.25 0.50 0.75 1.00 
Yi 1.0000 1.2840 1.6487 2.1170 2.7183 
P(x;) 1.0051 1.2740 1.6482 2.1279 2.7129 
у = Р(х) —0.0051 0.0100 0.0004 —0.0109 0.0054 


Algunas veces es adecuado asumir que los datos están exponencialmente relacionados. 
Esto requiere que la función de aproximación sea de la forma 


у = ре“ (8.4) 


у = Бх“, (8.5) 


para algunas constantes a у b. La dificultad de aplicar el procedimiento de mínimos cuadra- 
dos en una situación de este tipo proviene de intentar minimizar 


m 


Е = Yo — be™i)?, еп el caso de la ecuación (8.4) 


і=1 


316 


CAPÍTULO 8 = Teoría de aproximación 


llustración 


Tabla 8.5 


m 


Е = Yo — bx)’, enel caso de la ecuación (8.5). 
¡=1 


Las ecuaciones normales relacionadas con estos procedimientos se obtienen ya sea a 
partir de 


дЕ z ах ах 
бш. -23 0; — bee”) 
y 
3E m | | 1 
0===2 No = ре)(—рх;е), еп el caso de la ecuación (8.4), 
da en 
o 
дЕ m Ро 
0= = = 270 — bxf (xt) 
y 
3E m P 
0s — = 2 Уо — bx Mb(nx;)x7), enel caso de la ecuación (8.5). 
da 


і=1 


En general, no se puede encontrar una solución exacta рага estos sistemas en a у b. 
El método que se utiliza normalmente cuando se sospecha que los datos están exponen- 
cialmente relacionados es considerar el logaritmo de la ecuación de aproximación: 


In y =Inb+ax, enel caso de la ecuación (8.4), 


lny =Inb+alnx, enel caso de la ecuación (8.5). 


En cualquier caso, ahora aparece un problema lineal y las soluciones para ln b y a se pueden 
obtener al modificar adecuadamente las ecuaciones normales (8.1) y (8.2). 

Sin embargo, la obtenida de esta forma no es la aproximación por mínimos cuadrados para 
el problema original, y esta aproximación puede, en algunos casos, diferir significativamente 
de la aproximación de mínimos cuadrados para el problema original. La aplicación en el 
ejercicio 13 describe este problema. Esta aplicación se reconsiderará en el ejercicio 9 en la 
sección 10.3, donde la solución exacta para el problema exponencial de mínimos cuadrados 
se aproxima con métodos adecuados para resolver sistemas de ecuaciones no lineales. 


Considere el conjunto de datos en las primeras tres columnas de la tabla 8.5. 


i Xi Yi In y; х? xi ln y; 
1 1.00 5.10 1.629 1.0000 1.629 
2 1.25 5.79 1.756 1.5625 2.195 
3 1.50 6.53 1.876 2.2500 2.814 
4 1.75 7.45 2.008 3.0625 3.514 
5 2.00 8.46 2.135 4.0000 4.270 


7.50 9.404 11.875 14.422 


Tabla 8.6 


Figura 8.5 
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Si x; se grafica con In y;, los datos parecen tener una relación lineal, por lo que es razo- 
nable suponer una aproximación de la forma 


у = Бе“, Іо cual implica que In y = lnb + ax. 


Al expandir la tabla y suponer que las columnas apropiadas dan los datos restantes en la 
tabla 8.5. 
Usando las ecuaciones normales (8.1) y (8.2), 


_ (5)(14.422) — (7.5) (9.404) 


(5)(11.875) — 7.5} 0.5056 


y 
11.875)(9.404) — (14.422) (7.5 
Inb = ( q ›—( E = 1.122. 
(5)(11.875) — (7.5)? 
Con In b = 1.222, tenemos b = е!!22 = 3.071, y la aproximación asume la forma 
у = 3.071е05056:;, 
En los puntos de datos, estos valores se dan en la tabla 8.6 (consulte la figura 8.5.) ш 
х; Yi 3.071е°5056% [уг — 3.071е05056ч 

1 100 5.10 5.09 0.01 
2 1.25 5.79 5.78 0.01 
3 1.50 6.53 6.56 0.03 
4 1.75 745 744 0.01 
5 2.00 8.46 8.44 0.02 


y= 3.07 1e0-5056x 


0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 * 


La sección Conjunto de ejercicios 8.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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8.2 Polinomios ortogonales y aproximación por mínimos cuadrados 


La sección previa consideraba el problema de la aproximación por mínimos cuadrados para 
ajustarse a un conjunto de datos. El otro problema de aproximación mencionado en la intro- 
ducción aborda la aproximación de funciones. 

Suponga que f є C[a, b] y que se requiere un polinomio P, (x) de grado a lo sumo n 
para minimizar el error 


b 
/ [/(х) — Р,(х)] ах. 


а 


Para determinar un polinomio de aproximación por mínimos cuadrados, es decir, un 
polinomio para minimizar esta aproximación, sea 


п 

—1 К 

Р„(х) = anx" + anx" +: + ax +a = › ах 
k=0 


y defina, como se muestra en la figura 8.6, 


b n 2 
E = Буд, 1,.0.,49)= | (109- Ya) dx. 


k=0 


Figura 8.6 


El problema es encontrar los coeficientes reales ay, 41, ..., a, que minimizarán E. Una 
condición necesaria para los números ао, 41, . . . , An para minimizar Е es que 


дЕ 


—— = 0, рага сайа j = 0, 1,..., п. 
да; 


Puesto que 
b п b by т 2 

к= | FOP dx -25a | кло) ах | ( ам) de 

A k=0 g a 


tenemos 


дЕ Ж " bo 
d =>/ куо) +2Y a | хіі ах. 
ај а k=0 a 


Ejemplo 1 


Figura 8.7 
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Por lo tanto, encontramos Р, (х), las ecuaciones normales lineales (n + 1) 


n b b 
Уа f q it а= | х/ f(x) dx, paracada ј = 0, 1,..., п, (8.6) 
k=0 “1 E 


se deben resolver para las (п + 1) incógnitas ау. Las ecuaciones normales siempre tienen una 
única solución siempre y cuando f € C[a, b]. (Consulte el ejercicio 15.) 


Encuentre el polinomio de aproximación de grado 2 por mínimos cuadrados para la función 
f(x) = sen xx en el intervalo [0, 1]. 


Solución Las ecuaciones normales рага Р(х) = a,x? + ax + ay son 
2 2 1 0 


1 1 1 1 
a | Lasta | хаа | х 'ах= | sen Tx ах, 
0 0 0 
1 
a | sdsta f х аъ [a := | хѕеплх dx, y 
0 
1 
a | паа f xX asta f xtd х= | аяка 
0 


Realizando Іа integración obtenemos 


М. p _ 2 1 g М. ЕС. 1 М. Е. _ mt 
ao ¿A 322 = т 290 31 д^ w y 320 4% 50 = ас 
Estas tres ecuaciones en tres incógnitas se pueden resolver para obtener 
12x? — 120 720 — 6071? 
do = —=3 — *“-0.050465 y а = -a = 3 x 4.12251. 
л? TU? 


Por consiguiente, la aproximación del polinomio de grado 2 por mínimos cuadrados para 
fœ) = ѕеплх en [0, 1] es P,(x) = -4.12251x? + 4.12251x — 0.050465. (Consulte la 
figura 8.7.) ш 
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David Hilbert (1862-1943) 

fue un matemático dominante 

a finales del siglo xx. Se le 
recuerda mejor por impartir 

una charla en el Congreso 
Internacional de Matemáticos, 
en París, en 1900, donde planteó 
23 problemas que había pensado 
que sería importante que los 
matemáticos del siglo siguiente 
resolvieran. 


Definición 8.1 


Teorema 8.2 


Ejemplo 2 


= Teoría de aproximación 


El ejemplo 1 ilustra una dificultad al obtener una aproximación polinomial de míni- 
mos cuadrados. Se debe resolver un sistema lineal (n + 1) X (n + 1) para las incógnitas 
, An y los coeficientes en el sistema lineal son de la forma 


b j+k+1 j+k+1 
f bi аі 
хб ах = ————— ~ 
/ j+k+1 


Byers 


> 


un sistema lineal que no tiene una solución numérica fácil de calcular. La matriz en el siste- 
ma lineal es conocida como matriz de Hilbert, un ejemplo clásico para demostrar dificulta- 
des de error de redondeo (consulte el ejercicio 9 de la sección 7.5). 

Otra desventaja es similar a la situación que se presentó cuando los polinomios de 
Lagrange se presentaron por primera vez en la sección 3.1. Los cálculos realizados para 
obtener el mejor polinomio de enésimo grado Р, (х), no reducen la cantidad de trabajo re- 
querido para obtener P,,+1 (x), el polinomio del siguiente grado superior. 


Funciones linealmente independientes 


Ahora consideraremos una técnica diferente para obtener aproximaciones de mínimos cua- 
drados. Ésta resulta ser eficiente desde el punto de vista informático y una vez que se conoce 
P, (x) es sencillo determinar P, +1 (x) Para facilitar el análisis, necesitamos algunos concep- 
tos nuevos. 


Se dice que el conjunto de funciones { фо, . . . , n} es linealmente independiente en [a, b] si, 


софо (х) + сф (х) +--+ с„ф„(х) = 0, para todas las x e [a, b], 


entonces со = сү = ++- = с, = 0. De lo contrario, se dice que el conjunto de funciones es 
linealmente dependiente. п 


Suponga que, para cada j = 0,1,...,n, фу(х) es un polinomio de grado j. Entonces el 
conjunto {фо, ... , фФ„} es linealmente independiente en cualquier intervalo [a, b]. 


Demostración Sean со,... , Cn números reales рага los que 


P(x) = софо(х) + сІфі (х) +: + сһф,(х) = 0, рага todos х € [а, b]. 


El polinomio P (x) se anula en [a, b], por lo que debe ser el polinomio cero y los coeficientes 
de todas las potencias de x son cero. En particular, el coeficiente de x” es cero. Pero c, $ (x) 
es el único término en P (x) que contiene x”, por lo que debemos tener с„ = 0. Por lo tanto 


n—1 


Р(х) = Y сфу (х). 


j=0 


En esta representación de P(x), el único término que contiene una potencia de х"! es 
Cn-10n—1(x), por lo que este término también debe ser cero y 


п—2 


Р(х) =X 00: 


¡=0 


De la misma forma, las constantes restantes с„—2, Cn-3, ... , Сі, Co SON сего, lo cual implica 
que [do, Ф1,... , Ф) es linealmente independiente en [a, b]. [| 


51 фо(х) = 2,фу(х) = х—3,у ф(х) = х2+2х+7,у О (х) = ay+ax+a2x?. Muestre que 
existen constantes со, ст, y c2 tales que Q(x) = софо(х) + cii (x) + соф (х). 


Solución Рог el teorema 8.2 { фо, фі, фә} es linealmente independiente en cualquier interva- 
lo [a, b]. Primero observe que 


Teorema 8.3 


Definición 8.4 


Figura 8.8 


w(x) А 


pa Yoo ooooo=n=o _ 


= / 
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1 3 
1= 300), х=фб)+3 = pi) + „фо(х) 
y que 


3 1 
x = h(x) — 2x —7 = ф(х) — 2 |00) + оо =1 
1З 
= ф(х) — 21 (x) — 7000). 
Por lo tanto, 


1 3 13 
О(х) = a +41 [ + 20) + а ES = 241 (a) — а] 


3 


1 13 
= (5% + 2 — аз) ао) + [а — 202] ф(х) + афо (х). m 


La situación que se ilustra en el ejemplo 2 se mantiene en una configuración mucho 
más general. Si ] [„ denota el conjunto de todos los polinomios de grado а lo sumo n. El 
siguiente resultado se utiliza ampliamente en muchas aplicaciones de álgebra lineal. Su de- 
mostración se considera en el ejercicio 13. 


Suponga que {фо(х), dı (x), ... , ф„(х)} es un conjunto de polinomios linealmente indepen- 
dientes en [ [„. Entonces, un polinomio en [ [,, se puede escribir de manera única como una 
combinación lineal de фо(х), ф(х), ..., n(x). a 


Funciones ortogonales 


Analizar la aproximación general de una función requiere la introducción de las nociones de 
función de peso y ortogonalidad. 


Una función integrable w recibe el nombre de función de peso en el intervalo / si w (x) > 0, 
para todas las x en /, pero w (x) = 0 en cualquier subintervalo de 7. п 


El objetivo de una función de peso es asignar varios grados de importancia a las aproxi- 
maciones en ciertas partes del intervalo. Por ejemplo, la función de peso 


1 
yl = x? 


asigna menos énfasis cerca del centro del intervalo (—1, 1) y más énfasis cuando |x| está 
cerca de 1 (consulte la figura 8.8). Esta función de peso se usa en la siguiente sección. 

Suponga que {фо, фі, ... , On} es un conjunto de funciones linealmente independiente 
en [a, b] у w es una función de peso para [a, b]. Dada f € Cla, b], buscamos una combina- 
ción lineal 


w(x) = 


п 


Р(х) = У aga) 


к=0 
para minimizar el error 
b п 2 
E = Ela, ...,4n) =] 009 [109 - Zak] dx. 
a k=0 


Este problema reduce la situación considerada al inicio de esta sección en el caso especial 
cuando w(x) = 1 y (x) = x*, para cadak=0,1,...,n. 
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La palabra “ortogonal” significa 
“en ángulo recto”. Por lo que, 
en un sentido, las funciones 
ortogonales son perpendiculares 
entre sí. 


Definición 8.5 


Teorema 8.6 


Las ecuaciones normales relacionadas con este problema se derivan del hecho de que 
рага cada j = 0, 1,..., 7, 


дЕ Á 
0=— =2 | w(x) 16) = ES 


a; 
дај k=0 


п 


El sistema de ecuaciones normales se puede escribir como 
b п b 
| (х)/ @)ф;(х) dx = Y | / wapp; (х) dx, para ¡=0,1,...,n. 
a k=0 a 


Si las funciones фо, фі, . .., Ф, Se pueden seleccionar de tal forma que 


cuando j +Æ k, 


b 0 
| O OT -) (87) 


а; > 0, cuando ¡=k, 
entonces las ecuaciones normales se reducirán а 


b 


b 
/ waf OGA) ах = a f wË dx = ajaj, 
para cada j = 0, 1,..., п. Esto se resuelve fácilmente dado que 


1 b 
ар м (х) Р(х)фу (х) dx. 
a; a 


Por lo tanto, el problema de aproximación de mínimos cuadrados se simplifica en gran 
medida cuando se seleccionan las funciones фо, фі, ..., Ọn para satisfacer la condición de 
ortogonalidad en la ecuación (8.7). El resto de esta sección está dedicado a estudiar conjun- 
tos de este tipo. 


Se dice que {фо, фі, ..., фл) es un conjunto ortogonal de funciones en el intervalo [a, b] 
respecto a la función de peso w si 


b Р 
f э (х)ф(х)фу(х) dx = p cuando j # k, 


а; > 0, cuando j= К. 


Si, además, о; = 1 рага cada j = 0, 1,..., п, ѕе dice que el conjunto es ortonormal. m 


Esta definición, junto con las observaciones anteriores, produce el siguiente teorema. 


Si {фо, ... , фп) es un conjunto ortogonal de funciones en un intervalo [a, b] respecto a la 
función de peso w, entonces la aproximación por mínimos cuadrados para fen [a, b] respecto 
a w es 
n 
Р(х) = X `а)фу(х), 


¡=0 


donde, para cada ј = 0, 1,..., п, 


Ја (к)фу о) РО) dx 1 / 
= = j dx. 
а) Pour ГЕ 21. м(х)фу(х) Р(х) dx а 


A pesar de que la definición 8.5 y el teorema 8.6 permiten clases amplias de funciones 
ortogonales, en esta sección sólo consideraremos conjuntos ortogonales de polinomios. El 
siguiente teorema, que está basado en el proceso Gram-Schmidt, describe cómo construir 
polinomios ortogonales en [a, b] respecto a la función de peso w. 


Teorema 8.7 


Erhard Schmidt (1876-1959) 
recibió su doctorado bajo la 
supervisión de David Hilbert, 
en 1905, para un problema 
relacionado con ecuaciones 
integrales. Schmidt publicó 

en 1907 un artículo en el que 
proporcionaba lo que ahora se 
conoce como proceso Gram- 
Schmidt para construir una base 
ortonormal para un conjunto de 
funciones. Éste generalizaba los 
resultados de Jorgen Pedersen 
Gram (1850-1916), quien 
consideró este problema al 
estudiar los mínimos cuadrados. 
Sin embargo, Laplace presentó 
un proceso similar mucho antes 
que Gram y que Schmidt. 


Corolario 8.8 


Ilustración 
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El conjunto de funciones polinomiales {фо, фт, ..., n} definido de la siguiente forma es 
ortogonal en [a, b] respecto a la función de peso w: 


фо(х) =1 ф(х) =x — Bj,para cada x en [a, b], 
donde 


[AWAY ах 
1 => ý 
[м (х)[ф (б). dx 


y cuando k > 2, 


ф(х) = (х — Bpr- (x) — Crdr-2(x), por cada x en [а, b] 
donde 


J? awp dr 
S? w dx 


_ |. xw (х)фа-1(х)фе2(х) dx 
wpd 


El teorema 8.7 proporciona un procedimiento recursivo para construir un conjunto de 
polinomios ortonormales. La prueba de este teorema se sigue al aplicar inducción matemá- 
tica al grado del polinomio ф, (x). 


Para cualquier n > 0, el conjunto de funciones polinomiales { фо, ... , ф,} dado en el teore- 
ma 8.7 es linealmente independiente en [a, b] y 


b 
/ tora 


para cualquier polinomio Q(x) de grado k < n. 


Demostración Рага cada k = 0, 1,... ‚п, k(x) es un polinomio de grado k. Por lo que, el 
teorema 8.2 implica que {¢ġo, ... , фл) es un conjunto linealmente independiente. 

Sea Q(x) un polinomio de grado k < п. Mediante el teorema 8.3, existen números 
Co, ... , Ck de tal forma que 


k 


Ок) = X cojo. 


j=0 
Puesto que $, es ortogonal рага ф; para cada j = 0, 1,... ‚К, tenemos 
b k b k 
Proa a a WOA ae 0=0. m 
a j=0 a j=0 


El conjunto de polinomios de Legendre, {Р„(х)}, es ortogonal en [—1, 1] respecto a la 
función de peso w(x) = 1. La definición clásica de los polinomios de Legendre requiere 
que P, (1) = 1 para cada n y se utiliza una relación recursiva para generar los polinomios 
cuando n > 2. Esta normalización no será necesaria en nuestro análisis y los polinomios de 
aproximación por mínimos cuadrados generados en cualquier caso son fundamentalmente 
los mismos. 
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Figura 8.9 


Usando el proceso de Gram-Schmidth con Po(x) = 1 obtenemos 


Га dx 
B==—=0 у Р(х) = (х — Bi)Po(x) =x. 
fi ах 
Además, 
ГЕ х3 dx ГА x dx 1 
Ву= ст = Сост =, 
f! x? dx аа 3 
por lo que 


Pa (x) = (х — Ba) Pi (x) — Сә P(x) = (x — 0)х — І ‚1=х°— 


Los polinomios de Legendre de grado superior que se muestran en la figura 8.9 se deri- 
van de la misma forma. А pesar de que la integración puede ser tediosa, no es difícil con un 
sistema de álgebra para computadora. 


Tenemos 
Р(х) = хрх) — Рх) =? — 20 ха? 
3(x) = хР›(х 151600) =x 3^ 152 =* 5% 
y los siguientes dos polinomios de Legendre son 
6 3 10 5 
Р, ЕРЕ. те 2 ди. Р. ке. ЖИЕ 3 — Ne, 
Y (Xx) = х 7х + 35 y (х) = х 9 х + 1х E 


Los polinomios de Legendre fueron introducidos en la sección 4.7, en donde sus raíces, 
determinadas en la página 168, se utilizaron como los nodos en la cuadratura gaussiana. 


La sección Conjunto de ejercicios 8.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Pafnuty Lvovich Chebyshev 
(1821-1894) realizó un trabajo 
excepcional en muchas áreas 
como matemáticas aplicadas, 
teoría de números, teoría de 
aproximación y probabilidad. En 
1852, viajó desde St. Petersburgo 
para visitar matemáticos en 
Francia, Inglaterra y Alemania. 
Lagrange y Legendre habían 
estudiado los conjuntos 
individuales de polinomios 
ortogonales, pero Chebyshev 
fue el primero en observar las 
consecuencias importantes de 
estudiar la teoría en general. 

Él desarrolló los polinomios 
de Chebyshev para estudiar 

la aproximación por mínimos 
cuadrados y la probabilidad y, 
después, aplicar sus resultados 
a la interpolación, cuadratura 
aproximada y otras áreas. 
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A 8.3 Polinomios de Chebyshev y ahorro de series de potencia 


Los polinomios de Chebyshev {Т„(х)} son ortogonales en (— 1, 1) respecto a la función de 
peso w(x) = (1 —х?)-!?, А pesar de que se pueden derivar con el método еп la sección 
previa, es fácil proporcionar su definición y después mostrar que satisfacen las propiedades 
de ortogonalidad requeridas. 

Рага х € [—1, 1], defina 


Т„(х) = cos[n arccos х], para cada n > 0. (8.8) 


Quizá a partir de esta definición no sea obvio que para cada n, Т, (х) es un polinomio en x, 
pero ahora mostraremos esto. Primero, observe que 


To(x)=cos0=1 y Т(х) =cos(arccosx)= х. 
Para п > 1, introducimos la sustitución Ө = arccos x para cambiar esta ecuación por 
T,(0(x)) = 7,(0) = соѕ(п0), donde 0 є [0, л]. 
Una relación de recurrencia se deriva al observar que 


T,+1(0) = соѕ(п + 1)0 = cos 0 соѕ(п0) — sen 0 sen(n0) 


T,-1(0) = cos(n — 1)0 = cos 0 cos(n0) + sen Ө sen(n0). 


Al sumar estas ecuaciones obtenemos 


Tn+1(0) = 2с050 cosí(n0) — Т,_1(0). 


Al regresar а la variable х = соз 0, tenemos, paran > 1, 
Tn+1(x) = 2x cosín arccos x) — Т„—1(Х), 
es decir, 
Tari Œ) = 2хТ,(х) — Tp-1(x). (8.9) 


Puesto que То(х) = 1 y Т(х) = x, la relación de recurrencia implica que los siguientes 
tres polinomios de Chebyshev son 


Т»(х) = 2хТ\(х) — Tola) = 2х2 — 1, 
B = 2хТ(х) — Ti (x) = 4x — Зх, 


Tax) = 2xT3 (x) — Р(х) = 8x4 — 8x? + 1. 


La relación de recurrencia también implica que cuando n > 1, Т, (х) es un polinomio 
de grado п con coeficiente principal 2 ”7!. Las gráficas de Т), T2, T3 y Т; se muestran en la 
figura 8.10. 
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Figura 8.10 


Para mostrar la ortogonalidad de los polinomios de Chebyshev respecto a la función de 
peso w(x) = (1 — x?)7!2, considere 


1 Т,(х)Т» (х) d / cos(n arccos х) cos(m arccos х) d 
мыл = Ж. 
a М1—х? -1 V1l— x? 

Al reintroducir la sustitución Ө = arccos x obtenemos 


1 
а0 = ——— dx 
СМ1— x2 


ИО, d 
T — 
1 М1—х? 


Suponga que n  m. Puesto que 


0 л 
/ cos(n0) cos(m0) d0 = / cos(n0) cos(m0) аб. 
л 0 


cos(n0) cos(m0) = соки + т) + соѕ(п — т)0], 


tenemos 


OTC) dx = f |. cos((n + т)0) 40 + |, cos((n — т)0) dO 
1 м1 2х2 2 Јо 2% 


л 


sen((n – т)0)| =0. 
0 


sen((n + m)0) + ? 


1 1 
E +m) (n— m) 


Mediante una técnica similar (consulte el ejercicio 11), también tenemos 


OP _ ТАРР (8.10) 
=f М1 — x? 2 


Los polinomios de Chebyshev se utilizan para minimizar el error de aproximación. Ve- 
remos cómo se usan para resolver dos problemas de este tipo: 


Teorema 8.9 
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* Una colocación óptima de puntos de interpolación para minimizar el error en la interpola- 
ción de Lagrange 


e Un medio para reducir el grado de un polinomio de aproximación con pérdida mínima de 
precisión 


El siguiente resultado afecta los ceros y los puntos extremos en Т, (x). 


El polinomio de Chebyshev 7;, (x) de grado п > 1 tienen ceros simples en [—1, 1] en 


_ 2k —1 
Xx = COS x |, para cada k = 1,2,...,n. 
2n 
Además, T„(x) toma sus máximos absolutos еп 
=/ Кл =/ К 
Xy = COS к соп 7„(Х) = (-1), paracada k=0,1l,...,n. 


Demostración Si 


_ 2k— 1 
Xe = COS m j; parak=1,2,...,n. 
2n 


Entonces 


Е Е 2k — 1 2k —1 
T, (Xx) = cos(n arccos Ху) = cos | n arccos | cos Ei = Cos E =0. 
п 


Pero х; son distintas (consulte el ejercicio 12) y Т„(х) es un polinomio de grado n, por lo que 
todos los ceros de 7, (х) deben tener esta forma. 
Para mostrar la segunda declaración, primero observe que 


п sen (n arccos х) 


~I — x? 


T, (1) = costa arccos x)] = 


y que, cuando k = 1, 2,...,п — 1, 


Кл 
п sen (" arccos (cos (2) Р sen(kzr) o 
Кл i sen (£5) 
ү- (ы) 2 


Puesto que Т, (х) es un polinomio de grado n, su derivada Т’ (х) es un polinomio de gra- 
do (n — 1), y todos los ceros de Т/(х) se presentan en estos puntos distintos п — 1 (que son 
diferentes se considera en el ejercicio 13). Las únicas otras posibilidades para los máximos de 
Т, (х) se presentan en los extremos del intervalo [—1, 1], es decir, en х = 1 y en х, = —1. 

Para cualquier k = 0, 1,..., n, tenemos 


25у Кл k 
Т„(®„) = cos (" arccos (sos (=)D = соз(Кл) = (—1)“. 


Por lo que se presenta un máximo en cada valor par de k y un mínimo en cada valor impar. ш 


TEL) = 


Los polinomios mónicos de Chebyshev (polinomios con coeficiente principal 1) T,,(x) 
se derivan a partir de los polinomios de Chebyshev T,, (x) al dividir el coeficiente principal 
2"-1 Por lo tanto, 


BR da 1 
е у næ) = та porcada nz 1. (8.11) 
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Figura 8.11 


Teorema 8.10 


La relación de recurrencia satisfecha por los polinomios de Chebyshev implica que 
2 5 pS 
T(x) = xT (x) — 5700) y 


Ё n 12 
Tası (x) = хТ„(х) — 1 п—1(Х), por cada n > 2. (8.12) 


Las gráficas de Т, Т», 1», Т, у Т5 se muestran en la figura 8.11. 


Puesto que 7, (х) es sólo un múltiplo de T,(x), el teorema 8.9 implica que los ceros de 
Ť, (x) también se presentan en 


o 2k — 1 
Х = COS a л |, paracadak=1,2,...,n, 


y los valores extremos de Т, (х) paran > 1, ocurre еп 


k 


k Е 2 
X; = Cos (=) con ар = ER, рага cada k = 0, 1, 2,...,п. (8.13) 
п n= 


Sea que [ [, denota el conjunto de todos los polinomios mónicos de grado n. La rela- 
ción expresada en la ecuación (8.13) conduce a una propiedad de minimización importante 


que distingue 7, (x) de los otros miembros de [ [,. 


Los polinomios de la forma 7, (x) cuando n > 1, tienen la propiedad de que 


зех = ойх |Т„(х)| < ¿máx |P (x)], para toda P,, (x) € TÍ. 


Además, la igualdad se presenta sólo si Р, = To. 
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Demostración Suponga que P, (x) € П, y que 


1 А 
máx |Р„(х)| < = máx Р.О. 
ах | пб) < Эл—1 „К! п (Хх) 


Sea О = Т, — Р,. Entonces tanto Ў, (х) сото Р, (х) son polinomios mónicos de grado n, 
por lo que Q(x) es un polinomio de grado máximo (n — 1). Además, en los n + 1 puntos 
extremos х; de 7, (x), tenemos 


En 


Ор = Т) — Р(Х) = а= Р, (х). 


Sin embargo, 
1 
ACTOS E рага cada k =0,1,...,n, 
por lo que tenemos 
О(х) < 0, cuando kesimpar y О(х) > 0, cuando kes par. 


Puesto que Q es continuo, el teorema de valor intermedio implica que para cada j = 
0,1,... ,n — 1, el polinomio Q(x) tiene por lo menos un cero entre Хх, у Ху. Por lo tanto, 
O tiene por lo menos n ceros en el intervalo [—1, 1]. Pero el grado de Q(x) es menor que n, 
por lo que Q = 0. Esto implica que Р, = Ñ. 

ш 


Minimización del error en la interpolación de Lagrange 


El teorema 8.10 se puede utilizar para responder la pregunta de cuándo colocar nodos inter- 
polantes para minimizar el error en la interpolación de Lagrange. El teorema 3.3 en la página 
83 aplicado al intervalo [—1, 1] establece que, si xo, ... , х, son números distintos en el 
intervalo [—1, 1] y si f e C"*![—1, 1], entonces, para cada x e [—1, 1], existe un número 
&(х) en (—1, 1) con 


(п+1) 
FO- Ро) = Ea аа) 40), 
donde Р(х) es el polinomio de interpolación de Lagrange. En general, no existe control sobre 
¿(x), por lo que minimizar el error mediante la colocación acertada de los nodos xo, ... , Xn 
seleccionamos хо, ... , х„ para minimizar la cantidad 


[Œ = xo) Œ — 11) +++ Œ — Xp)! 


a lo largo del intervalo [— 1, 1]. 
Puesto que (x — хо)(х — x1) <- (х — Xn) es un polinomio mónico de grado (n + 1), 
acabamos de observar que el mínimo se obtiene cuando 


(x — хо)(х — x1) +++ (e — xn) = p1 (x). 


El valor máximo de |(х — хо) (х — х): -- (x — xn )| es más pequeño cuando se seleccio- 
na х рага cada k = 0, 1,...,nesel (k + 1)-ésimo cero de 7, +1. Por lo tanto seleccionamos 
Xk сото 


2k +1 ) 


Xk+1 = Cos (=r 


Puesto que тах xeļ-1,1] [7,41 (x)| = 27", esto también implica que 


1 
— = máx (х —X1)---(x—X < máx |(x—x0)--- (x —xp)l, 
2" © хє[—1,1] K 04 015 хє[—1,1] IC 0): п)! 


para cualquier selección de хо, x1, . . . , x, en el intervalo [— 1, 1]. El siguiente corolario sigue 
estas observaciones. 
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Corolario 8.11 


Ejemplo 1 


Suponga que P(x) es el polinomio de interpolación de grado a lo sumo n con nodos en los 
ceros de 7, +1 (x). Entonces 


1 
á — P < А (п+1) d пр 1]. 
„Шах |/0) (х)| < e (x)|, para cada f є С" [—1,1]. ш 


Minimización del error de aproximación en intervalos arbitrarios 
La técnica para seleccionar puntos para minimizar el error de interpolación se amplía hasta 
un intervalo cerrado general [a, b] al utilizar el cambio de variables 


z= ИФ ах +a +b] 


para transformar los números х, en el intervalo [—1, 1] en el número correspondiente х; en 
el intervalo [a, b], como se muestra en el siguiente ejemplo. 


Sea f(x) = хе" en [0, 1.5]. Compare los valores determinados por el polinomio de Lagran- 
ge con cuatro nodos igualmente espaciados con los dados por el polinomio de Lagrange con 
nodos determinados por los ceros del cuarto polinomio de Chebyshev. 


Solución Los nodos igualmente espaciados xy = 0, xı = 0.5, x2 = 1, y хз = 1.5 dan 


Lo(x) = —1.3333х? + 4.0000x? — 3.6667x + 1, 
Li (x) = 4.0000х° — 10.000x? + 6.0000х, 

La (x) = –4.0000х° + 8.0000x? — 3.0000x, у 
Із(х) = 1.3333x? — 2.000x? + 0.66667x, 


que produce el polinomio 


Ps (x) = Lo(0)(0) + [1 (х)(0.5е0°) + La(x)e! + Lala) (1.5! 5) 
= 1.387517 + 0.057570x? + 1.2730x. 


Para el segundo polinomio de interpolación, cambiamos los ceros Хк = cos((2k + 1) 
/8)л,рагак = 0, 1,2, 3, de Ta, desde [—1, 1] hasta [0, 1.5],por medio de la transformación 
lineal 


1 
ў = 5 10.5 — 0)5 + (1.5 +0)] = 0.75 + 075. 


Puesto que 


z T Е Зл Е 5л 
Хо = COS A = 0.92388, xı = cos z = 0.38268, хә = cos z = —0.38268, y 


Е 7л 
Хз = COS Ж = —0.92388, 
tenemos 
Žo = 1.44291, Х| = 1.03701, X,=0.46299, у %; = 0.05709. 
Los coeficientes polinomiales de Lagrange para este conjunto de nodos son 
Lo(x) = 1.8142х° — 2.8249x? + 1.0264x — 0.049728, 
Ї(х) = —4.3799х° + 8.5977x? — 3.4026x + 0.16705, 
La(x) = 4.3799х3 — 11.112x? + 7.1738x — 0.37415, y 
Їз(х) = —1.8142x? + 5.3390х? — 4.7976x + 1.2568. 


Tabla 8.7 


Tabla 8.8 


Figura 8.12 
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Los valores funcionales requeridos para estos polinomios se dan en las últimas dos co- 
lumnas de la tabla 8.7. El polinomio de interpolación de grado máximo 3 es 


B (x) = 1.3811х° + 0.044652x? + 1.3031x — 0.014352. 


x /(х) = хе“ X Р) = хе“ 
хо = 0.0 0.00000 Хо = 1.44291 6.10783 
ху = 0.5 0.824361 Ху = 1.03701 2.92517 
х = 1.0 2.71828 Х› = 0.46299 0.73560 
хз == 1.5 6.72253 Хз = 0.05709 0.060444 


Para comparación, en la tabla 8.8 se listan varios valores de x, junto con los valores de 
ДО), Рз(х) у B(x). A partir de esta tabla se puede observar que, a pesar de que el error por 
medio de P3(x) es menor al que resulta de utilizar Р, (х) alrededor de la mitad de la tabla, el 
error máximo relacionado con el uso de Рз (x), 0.0180, es considerablemente menor cuando 


se utiliza Рз(х), lo cual da el error de 0.0290 (véase la figura 8.2). ш 
x Fx) = хе" P3(x) [xe* — P3(x)| Bx) хе — P; (x)| 

0.15 0.1743 0.1969 0.0226 0.1868 0.0125 
0.25 0.3210 0.3435 0.0225 0.3358 0.0148 
0.35 0.4967 0.5121 0.0154 0.5064 0.0097 
0.65 1.245 1.233 0.012 1.231 0.014 
0.75 1.588 1:572 0.016 1.571 0.017 
0.85 1.989 1.976 0.013 1.974 0.015 
1.15 3.632 3.650 0.018 3.644 0.012 
1.25 4.363 4.391 0.028 4.382 0.019 
1.35 5.208 3.231 0.029 5.224 0.016 
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Ilustración 


Reducción del grado de los polinomios de aproximación 


Los polinomios de Chebyshev también se pueden utilizar para reducir el grado de un poli- 
nomio de aproximación con una pérdida mínima de precisión. Puesto que los polinomios de 
Chebyshev tienen un valor absoluto máximo-mínimo que se distribuye de manera uniforme 
en un intervalo, se pueden utilizar para reducir el grado de un polinomio de aproximación 
sin exceder la tolerancia del error. 

Considere aproximar un polinomio arbitrario de enésimo grado. 


Р„(х) = anx” + apa ax + a 


en [—1, 1] con un polinomio de grado como máximo n — 1. El objetivo es seleccionar 
Р,_1(х) en [ [,_;, de tal forma que 
máx |Р„(х) — Р„—1(х)| 
xe[—1,1] 
sea tan pequeño como resulte posible. 


Primero observamos que (Р, (х) — Р, (x))/a, es un polinomio mónico de grado n, por 
lo que al aplicar el teorema 8.10 obtenemos 


‚|1 
E g, Er) = Par) Z aT 


La igualdad se presenta precisamente cuando 
1 2 
z E0) = Pa-1)) = T,(x). 


Esto significa que deberíamos seleccionar 
Pa Œ) = Р(х) — а„Т„(х), 
y con esta selección tenemos el valor mínimo 


|а, | 


2п-1` 


xe[-1,1 


1 
máx |P Œ) — Pp-1(x)| = lan] máx |—(Р„(х) — Р,-1(х))| = 
] хе[—1,1] | аһ 


La función f(x) = е* se aproxima en el intervalo [—1, 1] mediante el cuarto polinomio de 
Maclaurin 


2 х3 х“ 


X 
Р. = 11 — edo aeS 
40) =1 +14 + A y 


que tiene error de truncamiento 


LEC e 
120 ~ 120 


IRD = ~ 0.023, раа—1<х<1. 


Suponga que un error de 0.05 es tolerable y que nos gustaría reducir el grado del polino- 
mio de aproximación mientras nos mantenemos dentro de esta cota. 

El polinomio de grado 3 o menor, que mejor se aproxima de manera uniforme a P4(x) 
en [—1, 1] 


A TO г шык 
x)= XI =a x)= X Xx X 
3 $ ы 2 6 24 24 


191 13,1, 
ото" 


Tabla 8.9 
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Con esta selección, tenemos 


1 


Е 1 
Рах) – Р›(х)| = lasTa(x)| < a m= < 0.0053. 


192 7 
Al sumar esta cota de error a la cota del error de truncamiento de Maclaurin obtenemos 
0.023 + 0.0053 = 0.0283, 


que está dentro del error permisible de 0.05. 
El polinomio de grado 2 o menor, que mejor se aproxima de manera uniforme a P3 (x) 
en [—1, 1] 


lla 
Р›(х) = Рз(х) — 6130) 
191 13,2 1з. 54 _з 191,9 ,B, 
= х х X х X = х х. 
192 4 6 6 4 192 8 24 


Sin embargo, 


O dd e j 
=-{—-| = a 
6\2 24 


que, cuando se suma a la cota del error ya acumulada de 0.0283, excede la tolerancia de 0.05. 
Por consiguiente, el polinomio de menor grado que mejor se aproxima a e* en [—1, 1] con 
una cota de error menor a 0.05 es 


l_ 
|P3(x) — Р(х) = ¿ho 


nogal y PE iad 3 
трт 
La tabla 8.9 muestra la función у los polinomios de aproximación en diferentes puntos en 
[—1, 1]. Observe que las entradas tabuladas para Р» se encuentran dentro de la tolerancia de 


0.05, aunque la cota de error para Р(х) excedió la tolerancia. п 
x e" Р(х) Ps(x) Р(х) le? — Р(х) 
0.75 0.47237 0.47412 0.47917 0.45573 0.01664 
—0.25 0.77880 0.77881 0.77604 0.74740 0.03140 
0.00 1.00000 1.00000 0.99479 0.99479 0.00521 
0.25 1.28403 1.28402 1.28125 1.30990 0.02587 
0.75 2.11700 2.11475 2.11979 2.14323 0.02623 


La sección Conjunto de ejercicios 8.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Aproximación de función racional 


La clase de polinomios algebraicos tiene algunas ventajas diferentes para uso en aproxima- 
ción: 


e Existe un número suficiente de polinomios para aproximar cualquier función continua en 
un intervalo cerrado dentro de una tolerancia arbitraria. 
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Henri Padé (1863-1953) aportó 
un estudio sistemático de lo que 
hoy llamamos aproximaciones de 
Padé en su tesis doctoral 

en 1892. Probó los resultados en 
su estructura general y también 
estableció claramente la conexión 
entre las aproximaciones de 

Padé y fracciones continuas. 

Sin embargo, Daniel Bernoulli 
(1700-1782) y otros habían 
estudiado estas ideas desde 1730. 
James Stirling (1692-1770) 
presentó un método similar 

en Methodus differentialis 
(Método diferencial) publicado 
en el mismo año y Euler usó 

la aproximación de Padé para 
encontrar la suma de una serie. 


= Teoría de aproximación 


e Los polinomios se evalúan fácilmente en valores arbitrarios. 


e Las derivadas e integrales de los polinomios existen y se determinan de manera sencilla. 


La desventaja de utilizar polinomios para aproximación es su tendencia a la oscilación. 
Con frecuencia, esto causa cotas de error en la aproximación polinomial que exceden sig- 
nificativamente el error promedio de aproximación porque las cotas del error se determinan 
mediante el error máximo de aproximación. Ahora consideramos los métodos que distribu- 
yen el error de aproximación de modo uniforme sobre el intervalo de aproximación. Estas 
técnicas implican funciones racionales. 

Una función racional r de grado N tiene la forma 


па) = 200, 
q(x) 
donde р(х) y q(x) son polinomios cuyos grados suman N. 

Todos los polinomios son una función racional (simplemente haga q(x) = 1), por lo 
que la aproximación mediante funciones racionales proporciona resultados que no son peo- 
res que la aproximación por medio de polinomios. Sin embargo, las funciones racionales 
cuyo numerador y denominador tienen el mismo o casi el mismo grado, a menudo producen 
resultados de aproximación superiores a los métodos polinomiales para la misma cantidad 
de esfuerzo computacional. (Esta declaración está basada en la suposición de que la canti- 
dad de esfuerzo computacional requerido para división es aproximadamente igual al de la 
multiplicación.) 

Las funciones racionales tienen la ventaja añadida de permitir aproximación eficiente de 
funciones con discontinuidades infinitas cerca, pero fuera, del intervalo de aproximación. En 
general, la aproximación polinomial es inaceptable en esta situación. 


Aproximación de Padé 


Suponga que r es una función racional de grado N = n + m de la forma 


PX) — Pot Pix +: + рах" 
q(x) qo + qix +-+ + Gmx” 


г(х) = 


que se utiliza para aproximar una función fen un intervalo cerrado / que contiene a cero. Para 
que r esté definida en cero, se requiere que до + 0. De hecho, podemos suponer que до = 1, 
si éste no es el caso, simplemente reemplazamos р(х) рог р(х)/4 y 9(х) por q(x)/q0. Por 
consiguiente, existen № + 1 parámetros 41, q2, ...,Qm» ро, P1, ---, Pn disponibles рага la 
aproximación de f mediante r. 

La técnica de aproximación de Padé es la extensión de la aproximación polinomial 
de Taylor para las funciones racionales. Se seleccionan los parámetros N + 1 de tal forma 
que FW (0) = r (0), para cada k =0,1,..., N. Cuando n = N y m = 0, la aproximación 
de Padé es simplemente el enésimo polinomio de Maclaurin. 

Considere la diferencia 


р(х) а 
q(x) 


Fa) рх) _ Ро) Erodi — Yio Pix 


Fa) - гк) = fa) 20) 269 


y suponga que f tiene la expansión de la serie de Maclaurin f(x) = 2, ajx’. Entonces 


У, ах! рТ qix’ — Уо pix’ 
q(x) 


Fx) —r(x) = (8.14) 


El objetivo es seleccionar las constantes q1, 92, ... , Pn de tal forma que 


‚Ят Y ро, р, .:. 


FOO) – 000) = 0, рага cada k = 0, 1,..., №. 


Ejemplo 1 
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En la sección 2.4 (consulte, en particular, el ejercicio 10 en el Conjunto de ejercicios 2.4 en 
línea) encontramos que esto es equivalente a f — r que tiene un cero de multiplicidad N + 1 
en x = 0. Como consecuencia, seleccionamos 41, 4, ---,Qm Y Po, P1, --- > Pn por lo que el 
numerador en el lado derecho de la ecuación (8.14), 


(ао + aix +A qix +++ gmx”) — (po + pix +: + pax”), (8.15) 


no tiene términos de grado menor o igual a N. 

Para simplificar la notación, definimos Pn+1 = Pn+2 = ··· = ру = Q y Qm+1 = Qm+2 
=... = ау = 0. Ahora podemos expresar el coeficiente de х“ en la expresión (8.15) de 
manera más compacta como 


i=0 


La función racional para la aproximación de Padé resulta a partir de la solución de N + 1 
ecuaciones lineales 


k 


Уак = р, k=O, 1,..., N 
1=0 


еп las № + 1 incógnitas q1, 42, ...,9п, ро, P1, ---, Pn- 


La expansión de la serie de Maclaurin рага e”* es 


Encuentre la aproximación de Padé para е7” de grado 5 con n = 3 y m = 2. 
Solución Para encontrar la aproximación de Padé, necesitamos seleccionar ро, рі, P2, рз, 


41, y q2 por lo que los coeficientes de Ne para k = 0, 1,...,5 son 0 en la expresión 


x2 x3 
(a FG) Hax tað — (pot pix + ри? + ри?) 


La expansión y agrupación de los términos produce 


5 1 + 1 1 0 р 1 + 
Ж? = 0: x“; -— = Pp; 
120 24“! 64? > qı t 92 = рә 
и o o f 1+ 
xX o: A у = U; X = = е 
24 64! 242 qı P1 
3 Ж 1 0 1 
коз => = = = E х: = . 
6 39 q2 = рз Po 


La solución de este sistema es 


_ 3 _ 3 _ 1 _2 ol 
pi = 5’ P= ap рз = 60° ышы =. 4 = 20 * 


Por lo que la aproximación de Padé es 

3 $2 143 

5% + 505 — A 
2 12 


r(x) = 


La tabla 8.10 muestra los valores de r(x) y Ps(x), el quinto polinomio de Maclaurin. La apro- 
ximación de Padé es claramente superior en este ejemplo. ш 
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Tabla 8.10 


x e™ Ps(x) le™ — Ps(x)| r(x) le™ —г(х)| 
02 0.81873075 0.81873067 8.64 x 1078 0.81873075 7.55 х 107? 
0.4 0.67032005 0.67031467 5.38 x 107% 0.67031963 4.11 x 1077 
0.6 0.54881164 0.54875200 5.96 x 105 0.54880763 4.00 x 105% 
0.8 0.44932896 0.44900267 3.26 х 107* 0.44930966 1.93 x 107% 
1.0 0.36787944 0.36666667 1.21 x 107 0.36781609 6.33 x 107 


El algoritmo 8.1 implementa la técnica de aproximación de Padé. 


Aproximación Racional de Padé 


Para obtener la aproximación 


— р(х) — Уф pix! 
q(x) У? одјхі 


r(x) 


para una función determinada f (x): 
ENTRADA enteros no negativos m y n. 
SALIDA coeficientes qo, q1, ---, qm Y Po, Pi, ---, Pn- 


Paso 1 Determine N =m +n. 


Paso 2 Parai=0,1,..., N determine а; = po 
(Los coeficientes del polinomio de Maclaurin son ay, ..., ay, que sería la 
entrada en lugar de calcularlos. ) 
Paso З Determine qo = 1; 
ро = ao. 
Paso 4 Рага і = 1, 2,..., N haga los pasos 5-10. (Establezca un sistema lineal con 
matriz В.) 


Paso 5 Рага ¡=1,2,...,1—1 
si j < п entonces haga b; j = 0. 


Paso 6 Sii < n entonces haga b;; = 1. 
Paso 7 Para j=i+1,i+2,..., № determine b; j = 0. 


Paso 8 Рага ј = 1, 2,...,і 
si / < т entonces haga bi n+j = 01у. 


Paso 9 Рата ј =п+і + 1,п+і +2, ..., М determine b; ; = 0. 
Paso 10 Determina b; уу = di. 
(Los pasos 11-22 resuelven el sistema lineal mediante pivoteo parcial.) 
Paso 11 Parai =п + 1, п +2,..., М — 1 haga los pasos 12-18. 


Paso 12 Sea k el entero más pequeño con y i <k < Му |bxil 
= тах; lb |. 
(Encuentre el elemento pivote.) 
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Paso 13 Si Бк; = 0 entonces SALIDA (“El sistema es singular”); 
PARE. 


Paso 14 Si k A i entonces (Intercambia fila і у fila К.) 
рага ј = і,і + 1,..., № +1 determine 


bcory = bi, j; 
bij = brz 
br į = bcory- 


Paso 15 Paraj = і +1, + 2,..., N haga los pasos 16-18. (Realice la eliminación.) 


Dis 
Paso 16 Determine xm = >. 
ii 
Paso 17 Рага k=i+1,i+2,...,N+1 
determine руд = bjk = хт. bix. 


Paso 18 Determine bj; = 0. 


Paso 19 Si ру у = 0 entonces SALIDA (“El sistema es singular”); 
PARE. 


: : b 1 тыз RES г 
Paso 20 Sim > 0 entonces determine qm = = (nicia la sustitución regresiva.) 


ру, 


b: A РРР 
Paso 21 Parai = N – 1, № —2,...,n + 1 determine qi-n = bN+ егы bija ` 


bii 
Paso 22 Рагаі = п, п – 1,..., 1 determine p; = bi N41 — Уи Di jizn 
Paso 23 SALIDA (90, 91,..., 4m, ро, Pi, <--> Pn); 
PARE. (El procedimiento fue exitoso.) ш 


Aproximación de fracción continuada 


Es interesante comparar el número de operaciones aritméticas requeridas para los cálculos 
de Ps(x) y r(x) en el ejemplo 1. Mediante multiplicación anidada, Ps(x) se puede expresar 


como 
1 1 1 1 
Ps(x) = (Er + a)" — в) + z)*- ee 


Al suponer que los coeficientes de 1, х, х?,х?,х* у х? se representan como decimales, un 
solo cálculo de Ps(x) en forma anidada requiere cinco multiplicaciones y cinco sumas/restas. 
Usando multiplicación anidada, r(x) se expresa como 


(Sar + )х—3)5х+1 
(х+#)х+1 


r(x) = 


> 


por lo que un solo cálculo de r(x) requiere cinco multiplicaciones, cinco sumas/restas y 
una división. Por lo tanto, el esfuerzo computacional parece favorecer la aproximación 
polinomial. 
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Sin embargo, al reexpresar r(x) mediante división continua, podemos escribir 


3 3:9, 1 
5х + ¿px х 


г(х) = 
1+ 2х + х2 


1х3 + 3х2 — 12x + 20 


х2 + 8х + 20 
_ a Lx – 2) 
3 3 12+8x +20 
1 17 -12 
== ¿++ - 
3 3 (не) 
х+Е(35/19) 
о 
1 17 – 152 
г(х) = х + + 3 


3 | (8.16) 
117 3125/361 
(х + 19 + гр) 


Escrita de esta forma, un solo cálculo de r(x) requiere una multiplicación, cinco sumas/ 
restas y dos divisiones. Si la cantidad de cálculos requeridos para división es aproximada- 
mente igual para la multiplicación, el esfuerzo computacional requerido para una evaluación 
del polinomio Ps(x) excede significativamente el requerido para una evaluación de la fun- 
ción racional r(x). 


Usando fracciones continuadas Al expresar una aproximación de función racional en una forma como la ecuación (8.16) 
para aproximación racional es recibe el nombre de fracción continuada. Esta es una técnica de aproximación clásica de 


un tema que se origina en los 
trabajos de Christopher Clavius 


interés actual debido a la eficiencia computacional de su representación. Es, sin embargo, 


(1537-1612). Por ejemplo, Euler, 218 técnica especializada que analizaremos más adelante. Un tratamiento bastante amplio de 
Lagrange y Hermite lo usaron en este tema y de la aproximación racional en general se puede encontrar en [RR], р. 285-322. 
los siglos хуш y XIX. A pesar de que la aproximación de la función racional en el ejemplo 1 da resultados 


superiores a la aproximación polinomial del mismo grado observe que la aproximación tiene 
una amplia variación en precisión. La aproximación en 0.2 es precisa dentro de 8 X 107°, 
pero en 1.0 la aproximación y la función sólo concuerdan dentro de 7 X 1075. Se espera esta 
variación de precisión porque la aproximación de Padé está basada en una representación 
de e *, y la representación de Taylor tiene una amplia variación de precisión en [0.2, 1.0]. 


Aproximación de la función racional de Chebyshev 


Para obtener aproximaciones de función racional precisa de forma más uniforme, usamos 
los polinomios de Chebyshev. El método general de aproximación de función racional de 
Chebyshev procede de la misma forma que la aproximación de Padé, excepto que cada 
término x* en la aproximación de Padé se reemplaza por el polinomio de k-ésimo grado de 
Chebyshev T(x). 

Suponga que queremos aproximar la función f mediante una función racional r de ené- 
simo grado escrita en la forma 


па) = PEPA 


, donde М = п ту дф = 1. 
o 9610) 


Al escribir f (x) en una serie relacionada con los polinomios de Chebyshev como 


со 


Јо) = Уат) 


k=0 


Ejemplo 2 
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da 
оо п 
Уо PrTi(x) 
ЈО) (0) = ) anka) – =a mn 
>, к=0 ФЕТ (Хх) 
o 
оо T т Т, == п Т, 
ро) =н) = No Ak 109) Lio 4k k(x) Уо Pk ra) (8.17) 
io Tk) 
Los coeficientes q1, 42, .--, qm Y ро, P1, ---, Pn Se seleccionan de tal forma que el nu- 


merador en el lado derecho de esta ecuación tiene cero coeficientes para T,(x) cuando 
k=0,1,..., N. Esto implica que la serie 


(ађТо(х) + a T Œ) + OTA) + qa Ti) + -H mI (x)) 
= (poTo(x) + p1T1(x) IS PnTn(x)) 
no tiene términos de grado menor o igual a М. 
Con el procedimiento de Chebyshev surgen dos problemas que lo hacen más difícil de 
implementar que el método de Padé. Uno se presenta porque el producto del polinomio q (x) 


y la serie para f(x) implican productos de los polinomios de Chebyshev. Este problema se 
resuelve al utilizar la relación 


1 
ROT = 5 [T + Tia o). (8.18) 


(Consulte el ejercicio 10 de la sección 8.3.) El otro problema es más difícil de resolver e 
implica el cálculo de la serie de Chebyshev para f(x). En teoría, esto no es difícil, si 


со 


Р(х) = у aTa), 


k=0 
entonces la ortogonalidad de los polinomios de Chebyshev implica que 


1 А 1 A А 
a [ LO a у ас 2 [ т) 


л 1 м1 = 2 л 1 м1 х2 


Prácticamente, sin embargo, estas integrales гага vez se pueden evaluar de forma cerrada 
y se requiere una técnica de integración numérica para cada evaluación. 


x, dondek > 1. 


Los primeros cinco términos de la expansión de Chebyshev para ет“ son 


Ps(x) = 1.266066To(x) — 1.130318T,(x) + 0.271495T,(x) — 0.04433773(х) 
+ 0.005474T,(x) — 0.0005437; (x). 


Determine la aproximación racional de Chebyshev de grado 5 con n = 3 y m = 2. 


Solución Encontrar esta aproximación requiere seleccionar ро, pı, P2, рз, qı. y д2 y de tal 
forma que k = 0, 1,2,3,4 y 5, los coeficientes de T(x) son O en la expansión 


Ё$(х)[Ту(х) + Т (х) + 47 (0)] — [poTo(x) + р1Т\(х) + рәТ»(х) + рзТз(х)]. 
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Tabla 8.11 


Usando la relación (8.18) y agrupando términos se obtienen las ecuaciones 


To: 1.266066 — 0.56515941 + 0.13574854› = po, 
Тү: —1.130318 + 1.401814q, — 0.5873284 = pı, 
Ta: 0.271495 — 0.587328q1ı + 1.268803: = р», 
Ту: —0.044337 + 0.138485q, — 0.565431q2 = рз, 
Ta: 0.005474 — 0.022440q, + 0.135748q, = 0, y 
Ту: —0.000543 + 0.002737q, — 0.0221694 = 0. 


La solución de este sistema produce la función racional 


1.055265To (x) — 0.6130167 (x) + 0.077478T,(x) — 0.004506753 (x) 
To(x) + 0.3783317 (х) + 0.0222167)(x) 


rr(x) = 


Al inicio de la sección 8.3 encontramos que 
Ту(х) = 1, Тү(х) =x, D(x)=2x?—1, y Ђ(х) = 4x — Зх. 
Al utilizarlas para convertir una expresión relacionada con potencias de x obtenemos 


0.977787 — 0.599499x + 0.154956x? — 0.018022x* 
0.977784 + 0.378331х + 0.044432x? 


rr(x) = 


La tabla 8.11 contiene los valores de гт(х) y, para propósitos de comparación, los valores de 
r(x) obtenidos en el ejemplo 1. Observe que la aproximación dada por r(x) es superior al 
de rr(x) para x = 0.02 y 0.4 pero el error máximo рага r(x) es 6.33 = 1075 en comparación 


con 9.13 X 107? рага rr(x). и 
х e™ r(x) јет" —г(х)| rr(x) le — rr(x)| 
0.2 0.81873075 0.81873075 7.55 x 107° 0.81872510 5.66 x 1076 
0.4 0.67032005 0.67031963 4.11 x 1077 0.67031310 6.95 x 1070 
0.6 0.54881164 0.54880763 4.00 x 1074 0.54881292 1.28 x 1076 
0.8 0.44932896 0.44930966 1.93 х 107? 0.44933809 9.13 x 107% 
1.0 0.36787944 0.36781609 6.33 х 1075 0.36787155 7.89 х 107% 


Га aproximación de Chebyshev se puede generar mediante el algoritmo 8.2. 


Aproximación racional de Chebyshev 
Para obtener la aproximación racional 


А Т 
по) = Кайл) 
уй к=0 4k Tk (x) 
para una función determinada f(x): 

ENTRADA enteros no negativos m y n. 


SALIDA los coeficientes qo, q1, ...,Qm Y Po, P1, ---, Pn- 
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Paso 1 Determine N =m +n. 


2 л 
Paso 2 Determine а) = — / fícos0) 40; (ЕІ coeficiente ay se duplica para 
л Jo eficiencia computacional.) 
Рага k = 1,2,..., N + т determine 


2 л 
а == I / (соз Ө) соз КӨ d8. 
л Jo 
(Las integrales se pueden evaluar usando el procedimiento de integración o 
los coeficientes se pueden colocar directamente.) 
Paso З Determine до = 1. 
Paso 4 Parai=0,1,..., N haga los pasos 5-9. (Configura un sistema lineal con 
Paso 5 Paraj =0,1,...,i жаш) 
si j < n entonces determine b; ; = 0. 
Paso 6 Sii < п entonces determine b; ; = 1. 


Paso 7 Paraj=i+1,i+2,...,n determine b; ; = 0. 
Paso 8 Paraj=n+1,n+2,...,N 


sii 4 0 entonces determine b; ; = — 1 (di4 j-n + ај) 
también determine b; = La ЕЕ 
Paso 9 Si i 5 О entonces determine Б; y+1 = а; 
también determine b; 41 = Таг. 
(Pasos 10-21 resuelven el sistema lineal mediante pivoteo parcial.) 


Paso 10 Parai=n>+1,n+2,..., М — 1 haga los pasos 11-17. 


Paso 11 Sea k el entero más pequeño con i < k < N y 
|bk i| = тах; =; lb; ¡l. (Encuentre el elemento de pivote. ) 


Paso 12 Si bx i = 0 entonces SALIDA (“El sistema es singular”); 
PARE. 


Paso 13 Sik - i entonces (Intercambie la fila y y k.) 
paraj=i,i+1,..., N + 1 determine 


bcory = bi, ГЕ 
bi j = bg, j; 
bk, j = bcory. 


Paso 14 Paraj=i+1,i+2,...,N haga los pasos 15-17. (Realice la 
eliminación.) 

bi 

Paso 15 Determine xm = +. 
ii 
Paso 16 Parak=i+1,1+2,...,.N+1 
determine Б, = bjx = хт. bik. 

Paso 17 Determine Бу; = 0. 


Paso 18 Si ру у = 0 entonces SALIDA (“En sistema es singular”); 
PARE. 
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А . DN N+1 
Paso 19 Sim > О entonces determine qm = paisa (Comience la sustitución regresiva.) 


ру, 


binya Ei Ё1}4]—п 
Paso 20 Parai = N – 1, N — 2,...,п + 1 determine qi-n = 7 . 


bii 
Paso 21 Parai = п, п — 1,...,0 determine p; = Б; м — 2” Di ¡Qj—n- 
Paso 22 SALIDA (qo, 41,..., qm, ро, P1>---> Рп); 
PARE. (El procedimiento fue exitoso.) н 


Еп 1930, Evgeny Remez 
(1896-1975) creó métodos 
computacionales generales de 
aproximación de Chebyshev 
para polinomios. Más adelante, método como punto de inicio para un método iterativo conocido como segundo algoritmo 


desarrolló un algoritmo similar Remez, que converge en la mejor aproximación. Un análisis de las técnicas relacionadas con 


El método de Chebyshev no produce la mejor aproximación funcional racional en el 
sentido de la aproximación cuyo error máximo es mínimo. Sin embargo, es posible usar el 


para la aproximación racional 

de funciones continuas definidas 
en un intervalo con un grado 
prescrito de precisión. Su trabajo 
abarcaba varias áreas de la teoría La sección Conjunto de ejercicios 8.4 está disponible en línea. Encuentre la ruta de 


de aproximación, asf como acceso en las páginas preliminares. 
los métodos para aproximar 


las soluciones de ecuaciones 
diferenciales. 


este procedimiento y una mejora de este algoritmo se puede encontrar en [RR], p. 292-305 
o еп [Pow], р. 90-92. 


8.5 Aproximación polinomial trigonométrica 


El uso de series de funciones de seno y coseno para representar funciones arbitrarias tiene 
su inicios en la década de 1750 con el estudio del movimiento de una cuerda vibrante. Este 
problema fue considerado por Jean 4” Alembert y, después, por el matemático más destacado 
de todos los tiempos, Leonhard Euler. Pero fue Daniel Bernoulli quien abogó primero por 
el uso de las sumas infinitas de seno y coseno como una solución para el problema, sumas 
que ahora conocemos como series de Fourier. En la primera parte del siglo хіх, Jean Baptiste 
Joseph Fourier utilizó estas series para estudiar el flujo de calor y desarrolló una teoría bas- 
tante compleja sobre el tema. 

La primera observación en el desarrollo de la serie de Fourier es que, para cada entero 
positivo n, el conjunto de funciones {фо, фі, ... , P2n—1), donde 


A finales del siglo хуп y principios 
del хуш, la familia Bernoulli 
produjo no menos de ocho 
matemáticos y físicos destacados. 1 
El trabajo más importante de фо(х) = =, 
Daniel Bernoulli implicaba la 2 
presión, la densidad y la velocidad 

del flujo de fluido, que resultó en 

lo que se conoce como el principio 

de Bernoulli. y 


p(x) =coskx, рага сайа k=1,2,...,n, 


Pn+k(x) = sen kx, рага сайа k = 1,2,...,n— 1, 


es un conjunto ortogonal en [—л, л] respecto а w(x) = 1. Esta ortogonalidad sigue el he- 
cho de que para cada entero j, las integrales de sen jx y cos jx sobre [—л, л] son O y pode- 
mos reescribir los productos de las funciones seno y coseno como sumas al utilizar las tres 
identidades trigonométricas 


1 
sen ѓу sen fh = 219984 — h) — cosít, + 2)], 
1 
COS [у COS h = z [cost — ta) + соѕ(й + 12)], y (8.19) 


1 
sen ѓу COS h2 = 5 18еп(л — h) + sen(t + 2)]. 


Joseph Fourier (1768-1830) 
publicó su teoría de series 
trigonométricas en Théorie 
analytique de la chaleur 
(Teoría analítica del calor) 
para resolver el problema de 
distribución de calor de estado 
estable en un sólido. 


Ejemplo 1 
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Polinomios trigonométricos ortogonales 


Sea 7, el conjunto de todas las combinaciones lineales de las funciones фо, фі, ... , P2n-1- 
Este conjunto recibe el nombre de conjunto de polinomios trigonométricos de grado me- 
nor o igual a n. (Algunas fuentes también incluyen una función adicional en el conjunto 
Pn (x) = sen nx.) 

Para una función f € С[-л, л], queremos encontrar la aproximación de mínimos cua- 
drados continuos mediante las funciones en 7, de la forma 


do n-1 
$һ(х) = э + а, соѕпх + У (as cos kx + b; sen kx). 
k=1 


Puesto que el conjunto de funciones { фо, P1,... , @2n-1} es ortogonal en [—2л, л] respecto 
а w(x) = 1, se sigue del teorema 8.6 en la página 382 y las ecuaciones en (8.19) sobre que 
la selección adecuada de coeficientes es 


Е JZ Рох) соѕ Кх dx 


1 л 
= / Р(х) соѕкх ах, рагасайа k = 0, 1, 2,..., п, 


т JZ (сов kxYdx x 
(8.20) 
y 
2 РО) ѕепкхах 1 ү" 
Ы = = = / / (Ох) ѕеп кх dx, рага сада k = 1, 2,...,п – 1. 
SF, (sen kx)? dx e A 


(8.21) 


El límite de S,, (x) cuando п > oo recibe el nombre de serie de Fourier de f. Las series 
de Fourier se usan para describir la solución de las diferentes ecuaciones ordinarias y dife- 
renciales parciales que se presentan en situaciones físicas. 


Determine el polinomio trigonométrico a partir de 7„ que aproxima 


Р(х) = lx], раа -л<х <л. 


Solución Primero necesitamos los coeficientes 


1 f7 1 ү г 2 f7 
а = — |x| dx = —— x dx + — x dx = — хах = л, 
Л Jr Л Jr T Jo T Jo 


1 [Т 2 [^ 2 k 
ak = — |x| соѕ кх dx = — xcoskx dx = — |(—1) – 1], 
mj л Jo mk? 


л 


paracadak=1,2,...,n, y 


1 “TT 
„= | |x| sen kx ах = 0, рагасайа k=1,2,...,n—1l. 
л 


= 


Al hecho de que todas las рг son 0 sigue que g(x) = |x| sen kx es una función impar para 
cada k y que la integral de una función impar continua sobre un intervalo de la forma [—a, 
a] es 0 (consulte los ejercicios 15 y 16). El polinomio trigonométrico de 7,, que se aproxima 
afes, por lo tanto, 


л 2 (1-1 
Sax) = ? + = 5 П cos kx. 
kal 


Los primeros polinomios trigonométricos para f(x) = |x| se muestran en la figura 8.13. ш 
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Figura 8.13 


~ 


Z шт 4 4 
у= 53(х) = 5 р COS X — gp COS 3x 


y = 50) = 50) = F f cosx 
у= 50) = 3 


Figura 8.14 


La serie de Fourier para f es 


р (иел 
S(x) = mm Sala) = 7 + е уэ 2 cos kx. 


Puesto que |coskx| < 1 para cada k y x, la serie converge, y S(x) existe para todos los nú- 
meros reales x. 


Aproximación trigonométrica discreta 


Existe un análogo discreto que es útil para la aproximación de mínimos cuadrados discretos 
y la interpolación de grandes cantidades de datos. 

Suponga que se proporciona un conjunto de puntos de datos pares 2m ((x;, y ел А 
con los primeros elementos еп pares que dividen de manera uniforme un intervalo cerrado. 
Por conveniencia, suponemos que el intervalo es [—л, л]; por lo que, como se muestra en 
la figura 8.14, 


xj =n + (Dn para cada j = 0, 1,...,2m — 1. (8.22) 
m 


Si no es [—7, л], se podría usar una transformación lineal simple para transformar los datos 
en esta forma. 


La meta en el caso discreto es determinar el polinomio trigonométrico $ „(х) en 7, que 
minimizará 


2m—1 


Е(5,) = Y у; – hE. 


¡=0 


Lema 8.12 


Euler usó primero el símbolo i en 
1794 para representar /=1 

en sus memorias De formulis 
differentialibus Angularibus. 
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Para hacerlo, necesitamos seleccionar las constantes ap, 41,... , аһ, b1, b2,... , bp-1 para 
minimizar 


2m-1 n-1 2 
Е(5) = Y fy; - E + an cos nx; + У (ak cos kx; + br senta) | } ‚ (8.23) 


j= k=1 


La determinación de las constantes se simplifica mediante el hecho de que el conjunto 
{фо, Фі, ..., фәл—1} es ortogonal respecto a la suma sobre los puntos uniformemente espa- 


m— 


ciados {хр Геп [—rr, л]. Con esto queremos decir que рага сайа k 5% Г, 


2m-1 


У? aaa) = 0. (8.24) 


j=0 
Para mostrar esta ortogonalidad utilizamos el siguiente lema. 


Suponga que el entero r no es un múltiplo de 2m. Entonces 


2m-1 2m-1 


Ы > соѕгх; = 0 y > senrx;=0. 
j=0 j=0 


Además, si r no es un múltiplo de m, entonces 


2т—1 2т—1 


° у; (cosrx;y? =m y 5 (sen rx)? =m. 
j=0 j=0 


Demostración La fórmula de Euler establece que con i? = —1, tenemos, para todos los 
números reales z, 


еі = cos z + i sen z. (8.25) 


Al aplicar estos resultados obtenemos 


2m-1 2m-1 2т—1 2т—1 
. == А . | __ ÍrX; 
X cosrxj +i › senrx;= > (cosrx;+isenrx;) = У ene, 
j=0 j=0 j=0 j=0 
Pero 
ей — етСст+/їл/т) = етіл. etinm, 
por lo que 
2m—1 2m-1 2m-1 
> cosrxj +i › senrxj =e "7 › eiam, 
j=0 j=0 j=0 


2m-1 
Puesto que > е! es una serie geométrica con el primer término 1 y radio е7/" Æ 1, 
tenemos j=0 


2m-1 irr/my2m 2іғл 
5 етт = 1— (e ) == 1—е 

a = ре еігл/т F I= еігл/т Е 
JE 


Pero e2"7 = cos 2rx + isen2rxr = 1, por lo que 1 — e?"7 = Оу 


2т—1 2т—1 2т—1 


› cosrxj +i › senrxj = е" > etitm = (у, 
¡=0 j=0 


j=0 
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Esto implica que tanto la parte real como la imaginaria son cero, por lo que 


2m-1 2т—1 


› cosrx¡=0 y › senrx;=0. 
j= j=0 


Además, si r no es un múltiplo de m, estas sumas implican que 


2m-1 2т—1 2m-1 


1 1 
) (сох)? = 2. 5 (1 + cos 2r.x ;) = 5 2т + D cos2rx;| = 2027" +0) = т 
j=0 j=0 j=0 
y, de igual forma, que 
2m-1 2m-1 1 
Y еве 5 5 (l= cos 2rx;) =m. п 
¡=0 ¡=0 


Ahora podemos mostrar la ortogonalidad establecida en la ecuación (8.24). Considere, 
por ejemplo, el caso 


2т—1 2т—1 
5 Px jpn (Aj) = y, (cos kx ;)(ѕеп lx ;). 
¡0 рат 


Puesto que 


1 
cos Кх; sen [xj = 


7 send + К)х; + sen(! — k)x;] 


y tanto (l + k) como (l — k) son enteros que no son multiplicadores de 2m, el lema 8.12 
implica que 


2m-1 


1 
5 sen(l — Ю)ху | = 5 (0+0) =0. 
¡=0 


2m-1 2т—1 


5 (cos kx;)(sen /х;) = 5 5 веп(/ + k)xj + 
j=0 


j=0 


Esta técnica se usa para mostrar que la condición de ortogonalidad se satisface para 
cualquier par de funciones y para producir el siguiente resultado. 


Las constantes en la suma 


do n-1 
Sal) = э + an cosnx + Уш cos kx + bj sen kx) 
k=1 


que minimizan la suma de mínimos cuadrados 


2m-1 


E(a0, ..., an, bi, -p ba) = Y Oj – hE 
j=0 


son 
1 2” 
. аай рага сайа k = 0, 1,..., п, 
y 
1 2"! 
s Ье = — У уузепКху, para cada k=1,2,...,n—1. ш 


j=0 
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El teorema se prueba al establecer las derivadas parciales de Е respecto a las ак y las by 
para cero, como se realiza en las secciones 8.1 y 8.2 y al aplicar la ortogonalidad para sim- 
plificar las ecuaciones. Por ejemplo, 


2m-1 


ЭЎ — 8,(х)]С sen kx), 


j= 


por lo que 
2m-1 2m-1 
0= › y; senkx;— > Sn (ху) sen kx; 
j=0 j=0 
2m-1 2m-1 2m-1 
ао 
= > уузепЁху— > › sen kx; — a, > sen kx ¡Cos nx j 

j=0 j=0 j=0 

п—1 2m—1 п—1 2т—1 2m-1 

2 

— > а у sen kx¡cos/x;— › bi > sen kx; sen lx; — bg › (sen Кх ;). 

ї=1 ј=0 l=1,  j=0 j=0 

[7 


La ortogonalidad implica que todas las sumas, excepto la primera y la última en el lado 
derecho son cero y el lema 8.12 establece que la suma final es m. Por lo tanto, 


2т—1 
О= у у; ѕеп Кх; — mbr, 
j=0 


lo cual implica que 


2т—1 


м: yj sen Кх у. 


El resultado para las ag es similar, pero necesita un paso adicional para determinar ао 
(consulte el ejercicio 19). 


Ejemplo 2 Encuentre S2(x), el polinomio trigonométrico de mínimos cuadrados discretos de grado 2 
para f(x) = 2x? — 9 cuando x está en [—x, л]. 


Solución Tenemos т = 2(2) — 1 = 3, por lo que los nodos son 
ху=л+ hn у у; = fa) = 2х —9, paraj=0,1,2,3,4,5. 
El polinomio trigonométrico es 
1 
Sa(x) = 290 + аз соѕ 2х + (ау cos x + bı sen х), 


donde 


5 


1 1 
СЕИ parak = 0, 1,2, y с аи 
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Los coeficientes son 


а= 5 (sem + / (-5) + (5) ло + (5) +1 (5) 


= —4.10944566, 


а = І (л л)соѕ(-л) + f (-5) cos (5) +f (-5) cos (-5) 


+ f(0)cos0+ f (2) сов (5) +f (2) сов (5) = -8.77298169, 


da = > (/‹=<л)сов(—2л) + / ( =) os ( 5) +f (-5) cos (5) 


л 2л 2л 4л 
+ 70) сов0 + f (5) cos (F) +f (2) cos (5) = 2.92432723, 


IO) 


Por lo tanto, 


1 
S(x) = 5 (—4.10944562) — 8.77298169 соз х + 2.92432723 соз 2х. 


La figura 8.5 muestra f(x) y el polinomio trigonométrico de mínimos cuadrados discretos 


S(x). 


Figura 8.15 


El siguiente ejemplo da una ilustración de cómo encontrar una aproximación por míni- 
mos cuadrados para una función definida en un intervalo cerrado diferente a [—x, л]. 
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Ejemplo 3 Encuentre la aproximación por mínimos cuadrados discretos 5з(х) para 
Р(х) = xt — 3x? + 2х2 — tan x(x — 2) en [0,2] 
por medio de los datos {(х;, Y ico» donde х; = Ј/5 у у; = f(x). 
Solución Primero necesitamos la transformación lineal de [0, 2] a [-7x, л] dada por 
23 = л(х; – 1). 


Entonces, los datos transformados tienen la forma 


or (a) 


El polinomio trigonométrico de mínimos cuadrados es, por consiguiente, 


do 2 
S3 (2) = 7 +43 cos 32 + У (ar cos kz + Ёк sen kz) |, 
k=1 
donde 
1 2 Zj 
ak = 2 0 + 2) coskz;, para k = 0, 1,2,3, 
y 


9 
1 ; 
к= = У (1+2) senkz;, рага k= 1,2. 
= 


La evaluación de estas sumas produce la aproximación 
S3(z) = 0.76201 + 0.77177 cos z + 0.017423 cos 2z + 0.0065673 cos 3z 
— 0.38676 sen z + 0.047806 sen 2z, 
y convertir de nuevo a las variables x nos da 


S3 (х) = 0.76201 + 0.77177 cos z (x — 1) + 0.017423 cos 2x (x — 1) 
+ 0.0065673 cos 37 (x — 1) — 0.38676 sen z (x — 1) + 0.047806 sen 27x (x — 1). 


La tabla 8.12 lista los valores de f(x) y S3(x). ш 
Бана у fœ 50) РО) = SE) 

0.125 0.26440 0.24060 2.38 х 107? 

0.375 0.84081 0.85154 1.07 х 107? 

0.625 1.36150 1.36248 9.74 х 1074 

0.875 1.61282 1.60406 8.75 х 107* 

1.125 1.36672 1.37566 8.94 х 107* 

1.375 0.71697 0.71545 1.52 х 107° 

1.625 0.07909 0.06929 9.80 х 107° 

1.875 —0.14576 —0.12302 2.27 х 107? 


La sección Conjunto de ejercicios 8.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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7 8.6 Transformadas rápidas de Fourier 


En la última parte de la sección 8.5 determinamos la forma del polinomio de mínimos 
cuadrados discretos de grado n en los puntos de datos 2m — 1 ((x;, y DS 1, donde 
ху = л +(//т)л, para cada j =0,1,...,2m-= 1. 

El polinomio trigonométrico de interpolación en Tm en estos puntos de datos 2m es casi 
el mismo que el polinomio de mínimos cuadrados. Esto se debe a que el polinomio trigo- 
nométrico de mínimos cuadrados minimiza el término de error 


2т—1 


E(Sm) = 5 (yj = Sn) > 


¡=0 


y рага el polinomio trigonométrico de interpolación, este error es 0 y, por lo tanto, minimi- 
zado cuando 5, (x¡) = yj, рага cada j = 0, 1,..., 2m — 1. 

Se necesita una modificación de la forma del polinomio, sin embargo, si queremos que 
los coeficientes supongan la misma forma en el caso de mínimos cuadrados. En el lema 8.12, 
encontramos que si r no es un múltiplo de m, entonces 


2m-1 


5 (cos rx) =m. 
j=0 


Por el contrario, la interpolación requiere calcular 


2т—1 


2 
5 (cos тх ;), 
j=0 


que (consulte el ejercicio 10) tiene el valor 2m. Esto requiere que el polinomio de interpola- 
ción se escriba como 


т—1 
m COS 
Sm(x) = какы + Sas cos kx + bx sen kx) (8.26) 
k=1 


si queremos que la forma de las constantes ag y Б, concuerde con las del polinomio de míni- 
mos cuadrados discretos; es decir, 


2m-1 
5 yjcoskxj, рага cada k = 0, 1,...,т, y 
j=0 


1 
m 


1 2т—1 
е bk = — У yjsenkx; рага cada К = 1,2,...,m — 1. 
j=0 

La interpolación de grandes cantidades de datos espaciados uniformemente mediante 
polinomios trigonométricos puede producir resultados muy precisos. Es la técnica de apro- 
ximación adecuada en áreas relacionadas con filtros digitales, patrones de campo de antena, 
mecánica cuántica, óptica en numerosos problemas de simulación. Hasta mediados de la 
década de 1960, sin embargo, el método no se había aplicado ampliamente debido al número de 
cálculos aritméticos requeridos para determinar las constantes en la aproximación. 

La interpolación de 2m puntos de datos mediante la técnica de cálculo directa requiere 
aproximadamente (2m)? multiplicaciones y (2m)? sumas. La aproximación de muchos miles 
de puntos de datos es muy común en áreas que requieren interpolación trigonométrica, por lo 
que los métodos directos para evaluar las constantes requieren operaciones de multiplicación 
y suma que llegan a millones. En general, el error de redondeo relacionado con este número 
de cálculos domina la aproximación. 


Leonhard Euler proporcionó 
primero esta fórmula en 1748 

en Introductio in analysin 
infinitorum, que hizo que las 
ideas de Johann Bernoulli fueran 
más precisas. Este trabajo basa 
los cálculos en la teoría de 
funciones elementales en lugar 
de curvas. 
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En 1965, un artículo de J. W. Cooley y 1. W. Turkey en el diario Mathematics of Compu- 
tation [CT] (Matemáticas de la computación) describía un método diferente para calcular 
las constantes en el polinomio trigonométrico de interpolación. Este método sólo requiere 
O(m log, т) multiplicaciones y O(m log, т) sumas, siempre y cuando т sea seleccionada de 
manera adecuada. Para un problema con miles de puntos de datos, esto reduce el número 
de cálculos de millones a miles. En realidad, el método había sido descubierto algunos años an- 
tes de que apareciera el artículo de Cooley-Tukey pero había pasado desapercibido. ([Brigh], 
pp. 8—9, contiene un resumen histórico pero interesante del método). 

El método descrito por Cooley y Tukey es conocido ya sea como algoritmo Cooley- 
Tukey o el algoritmo de la transformada rápida de Fourier (FFT) y ha conducido a una 
revolución en el uso de polinomios trigonométricos de interpolación. El método consiste 
en organizar el problema de tal forma que el número de puntos de datos utilizado se pueda 
factorizar fácilmente, de modo especial en potencias de dos. 

En lugar de evaluar directamente las constantes a; y by, el procedimiento de la transfor- 
mada rápida de Fourier calcula los coeficientes cg complejos en 


1 те 
ES (8.27) 
m 


donde 


2т—1 
Сұ = Y yan, para cada k = 0, 1,..., 2m — 1. (8.28) 
j=0 


Una vez que las constantes c se han determinado, az y bx se pueden recuperar por medio 
de la fórmula de Euler, 


e? = cosz + i sen z. 
Para cada k = 0, 1,... ,m, tenemos 
1 1 1 2т—1 1 2т—1 
бы =j k ир —їлК кесе „їклт]/т„—їлК р чый „„їК(—л+(л]/т)) 
„© ) 606 т >, yje e a >, yje 
=) j=0 
2т—1 А Р 
1 л] ; л] 
== 5 yj (cosa (-я + ) + ¡sen К (-я + )) 
т = т т 
1 2т—1 
= = 5 у;(соѕ kx; + isen kx;). 
j=0 
Por lo que dada c+, tenemos 
| (—1)* 
ax + ibi = a E (8.29) 


Por conveniencia notacional, by y bm se suman al conjunto, pero ambos son 0 y no contribu- 
yen a la suma resultante. 

La característica de reducción-operación de la transformada rápida de Fourier resulta 
de calcular los coeficientes c en grupos y utiliza como relación básica el hecho de que para 
cualquier entero л, 


плі 


е"! = соѕпл + і ѕепил = (—1)”. 
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Suponga que т = 2” para algunos enteros positivos p. Рага cada k = 0, 1,..., т — 1, 
tenemos 
2т—1 2т—1 2т—1 
Ck + сты = 5 уре!" + 5 уе! "+®лу/т = 5 yje +e"), 
j=0 j=0 j=0 
Pero 


14 gti = 2, si ј еѕ раг, 
0, sij еѕ ітраг, 


рог lo que sólo hay que sumar т términos diferentes de cero. 
Si j se reemplaza por 2j en el índice de la suma, podemos escribir la suma como 


т—1 


ck + ст = 2 Y узе" 00)", 


j=0 
es decir, 
т—1 
Ck + Ст = 2 5 y ¡e TiD, (8.30) 
j=0 
De forma similar, 
т—1 
Ck = сты = ?еїіктіт y yaje 0D, (8.31) 
j=0 


Puesto que ck y Cm+x se pueden recuperar a partir de las ecuaciones (8.30) y (8.31), estas 
relaciones determinan todos los coeficientes cg. También observe que las sumas en las ecua- 
ciones (8.30) y (8.31) son de la misma forma que la suma en la ecuación (8.28), excepto que 
el índice т ha sido reemplazado por т/2. 

Existen 2m coeficientes Co, C],... ,C2m-1 que deben calcularse. Usar la fórmu- 
la básica (8.28) requiere 2m multiplicaciones complejas por coeficiente, para un total de 
(2m)? operaciones. La ecuación (8.30) requiere m multiplicaciones complejas para cada 
k=0,1,...,m—1, y la ecuación (8.31) requiere m+1 multiplicaciones complejas para 
cada k = 0, 1,...,m — 1. Utilizar estas ecuaciones para calcular со, с|,... , C2m-1 reducen 
el número de multiplicaciones complejas desde (2m)? = 4m? hasta 


m-m-+múm +1) = 2т? +m. 


Las sumas en las ecuaciones (8.30) у (8.31) tienen la misma forma que la original у т es 
una potencia de 2, por lo que la técnica de reducción se puede volver a aplicar a las sumas en 
las ecuaciones (8.30) y (8.31). Cada una de estas es reemplazada por dos sumas desde j = 0 
hasta j = (m/2) — 1. Esto reduce la parte 2m? de la suma a 


л mM (2 +1) Е 
: : =m +m. 
2 2 2 2 


Por lo que ahora se necesita un total de 
(m? + m) +m = т? + 2m 


multiplicaciones complejas en lugar de (2m)?. 


Ilustración 
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Al aplicar la técnica una vez más obtenemos cuatro sumas, cada una con m/4 términos 
y reduce la parte m? de este total a 


9] 


para un total nuevo de (m?/2) + 3m multiplicaciones complejas. Repetir el proceso r veces 
reduce el número total de multiplicaciones complejas requeridas a 


т? 


y2 + mr. 


El proceso está completo cuando r = р + 1 porque entonces tenemos т = 2? y 2m = 
2P+! Por consiguiente, después de r = р + 1 reducciones de este tipo, el número de mul- 
tiplicaciones complejas se reduce de (2m)? a 


(2^)? 
2p=1 


+т(р + 1) = 2т + pm +m = 3m + m log, т = O(m log, т). 


Debido a la forma en que se ordenan los cálculos, el número de adiciones complejas reque- 
ridas es comparable. 

Para ilustrar la significancia de esta reducción, suponga que tenemos т = 2!° = 1024. 
El cálculo directo de ср, para k = 0, 1,... ,2m — 1, requeriría 


(2m)? = (2048)? ~ 4200000 


de cálculos. El procedimiento de la transformada rápida de Fourier reduce el número de 
cálculos a 


3(1024) + 1024 log, 1024 ~ 13300. 


Considere la técnica de la transformada rápida de Fourier aplicada a 8 = 2° puntos de datos 
[z Y izo» donde x; = —л + јл/4, рага cada j = 0, 1,..., 7. En este caso, 2m = 8, 
así m = 4 = 22ур =2. 

A partir de la ecuación (8.26), tenemos 


3 
4 з 
qq ка ше У (ar cos kx + by sen kx), 
2 k=1 
donde 
a їз 
а= Di у „= д юкны, k=0,1,2,3,4. 


Defina la transformada de Fourier como 


7 
1 ik 
a \ cpet”, 
j=0 


donde 
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Entonces mediante la ecuación (8.31) para k = 0, 1, 2, 3, 4, tenemos 
1 —ікл Еи ib 

=ске = а ibg. 
4 k k k 


Mediante cálculo directo, las constantes complejas c están dadas рог 
Co = Yo + у + у2 + уз + ул + Ys + ув + ут; 


(57) 4 (5 -) i+1 
бї == — |у i 
1 Уо Wa 1 y2 5 Уз 


/2. 


y5 


сз = Yo + iyi — уз — 1y3 + ул + 1ys — ув — іу; 


n- (aa (3) 
aat (o (60) (унн (o 
а) (9) 


c4 = уо — у + y2 — уз + у4 — Ys + Y6 — ут; 
1+1 
2; 


1+1 . 
ёз = Yo = A yı +iy2 Y Уз = Ya + 


c6 = Yo іу — уз + Туз + уд — 155 — Ye + iy7; 


(>) : (7) (5) de + (5) 

Ст = уо Ly 3 1Y6 = | у. 

т = У з yı 2 WA y У4 J y5 y 7З 7 
Debido al pequeño tamaño del conjunto de puntos de datos, muchos de los coeficientes de 
уу en estas ecuaciones son 1 о —1. Esta frecuencia disminuirá en una aplicación más gran- 
de, para contar las operaciones computacionales de manera precisa, la multiplicación por 


lo —1 se incluirá, a pesar de que no sería necesaria en este ejemplo. Con esta compren- 
sión, se requieren 64 multiplicaciones/divisiones y 56 sumas/restas para el cálculo directo 


de C0,C1,...,C7. 
Para aplicar el procedimiento de transformada rápida de Fourier con r = 1, primero 
determinamos 
со + С. Сз +C6 
de = 7 = 0+2 + у + y6; d4 = 5 = yo — y2 + ул — ув; 
Co — C4 C2 — C6 7 
dı = E уз + уз + yr; Вес = = (у — уз + уз — ут); 
сі + с5 ч i сз +С А ; 
dh = ——— = уо + iy — уз — iye; de = 7 = 0-0 Ya + ув; 
C1 С5 Сз — С7 
аз = —— d; =-— 
А 2 7 2 
1+1 А А t=] А А 
= Y += — іу) = 5) 0" їуз — уз +1y7). 
Entonces, definimos, para r = 2, 
do + da dz + dé 
e = = Yo + ул; e4 = = Yo — у4; 
do —4@ d = de В 
e = t = y2 + y6; es = —=3— =i (y2 — ув); 
2 2 
idi+ds . id3 + 45 1 — 1 
e у суз Ї(у\ + y5); di ( 75 ) Qı = уз); 
idı — ds ta idz — 45 fi=1 ( ) 
ез = =i Р ет = = і 2 . 
3 2 Уз T y7 7 2 J Уз — y7 
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Finalmente, para r = p + 1 = 3, definimos 


eo + ед (GF Da +e _ (fi-l 
h= z = А = Уг; 
„2 
eo — e, (+ PEE Jez — е -1 
MS == Y = = уз; 
„2 
р СОИ, | р „_ =i= | 
= „= Ya; 6 = а уз; 
Р јер — е5 . Р (i = 1)//2)ез — ет =ї = 1 
=————=!{ E == == А 
3 2 y6 7 2 Wo Ут 
Со, ...,С7, 0, ...,7,е0,...,ет,у fo, ---, fy son independientes de los puntos de datos 


particulares; dependen solamente del hecho de que m = 4. Para cada m, existe un conjunto 
único de constantes {ск} 3, (d 423, {ек}, у doo. Esta раме del trabajo no es 


necesaria para una aplicación particular; sólo se requieren los вее cálculos: 


te 


љ= у; Л= у; hA=ly f = іу; 


Коо A соо. --(57 | _ {+1 
n= (Су): = ( 7)» Ј = E n=)» 


ек: 
| i— l 
=f+4 a=-ilh+t fh) e=- 7 (А + 35); 
і + -) 
e=-= (6 + f); 
( /2 
ea=f-f es=f-—f; e= fa- fs e= fe- Л. 
de: 
do = ед +е; di = –1(е + ез); Ф = ед + е5; dz = —i(e6 + ел); 
da=€ = е; 05 = е – е3; (6 = ед е5; di = еб – ет. 
Ck: 
=d +d; ci =d +d; c2=d4+d5; c3 = 4 + d; 
c4=d-di; cs = 0 – d3; с = 4 – 455 с =d6— d}. 
Calcular las constantes со, c1, . . . , су de esta forma requiere el número de operaciones 


mostradas en la tabla 8.31. Observe de nuevo que la multiplicación por 1 o —1 se ha incluido 
en el conteo, a pesar de que no requiere esfuerzo computacional. 


Tabla 8.13 Paso Multiplicaciones/divisiones Sumas/restas 
(La fi) 8 ч 
(La e,:) 8 8 
(La d;:) 8 8 
(La c;:) 0 8 


Total 24 24 
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La falta de multiplicaciones/divisiones al encontrar cz refleja el hecho de que рага cual- 


quier m, los coeficientes {с} Ду 1 Se calculan а partir de мат" de la misma forma: 


ск = dək + Ф Y Ck+m = dək — Фа, para k =0,1,...,m— 1, 


por lo que no existen multiplicaciones complejas. 

En resumen, los cálculos directos de los coeficientes со, Сі, . . . , су requieren 64 mul- 
tiplicaciones/divisiones y 56 sumas/restas. La técnica de la transformada rápida de Fourier 
reduce los cálculos a 24 multiplicaciones/divisiones y 24 sumas/restas. и 


El algoritmo 8.3 realiza la transformada rápida de Fourier cuando т = 2? para algunos 
enteros positivos p. Se pueden hacer modificaciones a la técnica cuando m toma otras formas. 


Transformada rápida de Fourier 


Para calcular los coeficientes en la suma 


2т—1 2т—1 
1 : 1 
— у ce = — у с1(соѕ kx + i sen kx), donde i = у 1, 
= er 


para los datos ((x ;, y 27 | donde т =P yx; = –л + јл/трагај = 0, 1,...,2т— 1: 


ENTRADA т, р; Yo, У, +++ > Y2m-1- 
SALIDA números complejos co, ... , C2am—1; Números reales ao, ... , а; bj, ... , Ра. 


Paso 1 Determine M = т; 
а= р 
{ = елі/т, 
Paso 2 Para j =0,1,... ,2m — 1 determine су = yj. 


Paso 3 Paraj=1,2,...,M determine £; =¿7; 
Ejpm = Ej. 
Paso 4 Determine K = 0; 
& =l. 
Paso 5 Para L = 1,2,... , р + 1 haga los pasos 6-12. 
Paso 6 Mientras K < 2m — 1 haga los pasos 7-11. 
Paso 7 Para ] = 1,2,... ,M haga los pasos 8-10. 
Paso 8 SeaK = kp -2P + Кр 2P7! +- + ki -2 + ko; 
(Descomponga k.) 
determine Kı = К/24 = kp : 27741 + -+ + Кир 2 + kg; 
Ka = kg :2P + kg+1 .2р-1 + + kp: 24. 
Paso 9 Determine y =ск+мёк›; 
ск+м = CK — ; 
ск = ск +1. 


Paso 10 Determine K = К + 1. 


Paso 11 Determine К = К + М. 
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Paso 12 Determine K =0; 
М = М/2; 
qa=q-1. 
Paso 13 Mientras K < 2m — 1 haga los pasos 14-16. 
Paso 14 SeaK = к, . 2? + kpi 2р1 4... 4:2 + К; (Decomponga k.) 
determine j = ko : 2? + 2271 +... Кр 2+ К. 
Paso 15 Si j > К entonces intercambie су y ск. 


Paso 16 Determine К=К-+1. 


Paso 17 Determine ay = со/т; 
аһ = Ве(е "с, /т). 
Paso 18 Para ј = 1,... ‚т — 1 determine a; = Ке(е !7/с}/т); 
b; = (е !7/с}/т). 
Paso 19 SALIDA (су, ... ,C2m-1; а0,... , а; Р1,..., Dm-1); 
PARE. a 


Ejemplo 1 Encuentre el polinomio trigonométrico de interpolación de grado 2 en [— л, л] para los datos 
Tæ, лз}, donde f(x) = 2x? — 9. 


Solución Tenemos 


8 3 

а= ¿Sept para k =0,1,2 y b= ¿2109 ѕеп(х ;) por lo que, 
1 л л 

=> (7л) 27 (-5) +/(0)+/ (5)) = -3.19559339, 


а = Е (fx) соѕ(-л) + (5) cos (-35) + fO)cos0 + f (5) cos (5)) 
= —9.86960441, 


а = l (7л) со5(-2л) + (5) соѕ(-л) + (0) соѕ0 + f (5) cos =) 


= 4.93480220, 
y 
bi = _ (fr) sení—=1)+ f (-3) sen (3) + f(0)sen0+ f (5) sen (5)) = 0. 
Por lo que, 


1 
(х) = 3 (—3.19559339 + 4.93480220 cos 2х) — 9.86960441 cos x. 


La figura 8.16 muestra Ax) y el polinomio trigonométrico interpolante Sa(x). п 
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Figura 8.16 


El siguiente ejemplo ilustra cómo encontrar un polinomio trigonométrico interpolante 
para una función definida en un intervalo cerrado diferente a [—x, л]. 


Ejemplo 2 Determine el polinomio de interpolación trigonométrica de grado 4 en [0, 2] para los datos 
(7/4, FUI Y о, donde f(x) = х* — 3x? + 2х2 — tan x(x — 2). 


Solución Primero necesitamos transformar el intervalo [0, 2] a [~ 7x, л]. Esto está dado por 
1) = П (х а= 1), 


por lo que los datos de entrada para el algoritmo 8.3 son 


El polinomio de interpolación en z es 


Sa(z) = 0.761979 + 0.771841 cos z + 0.0173037 cos 2z + 0.00686304 cos 32 
— 0.000578545 cos 4z — 0.386374 sen z + 0.0468750 sen 2z — 0.0113738 sen 3z. 


El polinomio trigonométrico Sa(x) en [0, 2] se obtiene al sustituir z = л (x — 1) en Sa(z). 
Las gráficas de y = f(x) у Sa(x) se muestran en la figura 8.17. Los valores de f(x) y Sa(x) están 
determinados en la tabla 8.14. ш 
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Figura 8.17 

Tabla 8.14 , fœ Salx) ЦРО) = 5з(х)| 
0.125 0.26440 0.25001 1.44 х 1072 
0.375 0.84081 0.84647 5.66 х 107 
0.625 1.36150 1.35824 3.27 х 10-3 
0.875 1.61282 1.61515 2.33 х 107? 
1.125 1.36672 1.36471 2.02 x 107? 
1.375 0.71697 0.71931 2.33 x 107? 
1.625 0.07909 0.07496 4.14 x 107? 
1.875 —0.14576 —0.13301 1.27 х 1072 


Más detalles sobre la verificación de la validez del procedimiento de la transformada 
rápida de Fourier se pueden encontrar en [Ham], que presenta el método desde un enfoque 
matemático, o en [Brac], donde la presentación está basada en métodos que quizá sean fami- 
liares para los ingenieros. 

[AHU], p. 252-269 es una buena referencia para un análisis de los aspectos computa- 
cionales del método. La modificación del procedimiento para el caso cuando m no es una 
potencia de 2 se puede encontrar en [Win]. Una presentación de las técnicas y el material 
relacionado desde el punto de vista del álgebra abstracta aplicada se da en [Lau], p. 438-465. 


La sección Conjunto de ejercicios 8.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


E N 8.7 Software numérico 


La biblioteca IMSL proporciona un número de rutinas de aproximación incluyendo: 


1. 
2. 


Los mínimos cuadrados lineales se ajustan a los datos con estadística 

Los mínimos cuadrados discretos se ajustan a los datos con la selección del usuario 
de funciones de bases 

Aproximación de mínimos cuadrados de spline cúbico 
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4. Aproximación racional ponderada de Chebyshev 
5. La transformada rápida de Fourier se ajusta a los datos 


La biblioteca NAG proporciona rutinas que incluyen el cálculo de lo siguiente: 


1. La aproximación polinomial de mínimos cuadrados mediante una técnica para mi- 
nimizar el error de redondeo 

2. La aproximación de mínimos cuadrados de spline cúbico 

3. Mejor ajuste en el sentido !; 

4. Mejor ajuste en el sentido l% 

5. La transformada rápida de Fourier se ajusta a los datos 


La biblioteca netlib contiene una rutina para calcular la aproximación de mínimos cua- 
drados polinomiales para un conjunto discreto de puntos y una rutina para evaluar este poli- 
nomio y cualquiera de sus derivadas en un punto determinado. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Aproximación de eigenvalores 


Introducción 


Las vibraciones longitudinales de un barra elástica de rigidez local p(x) y densidad p(x) se 
describen mediante la ecuación diferencial parcial 


д?р д dv 
об) (9, t) = Эх poto, 2 


donde v(x, t) es el desplazamiento longitudinal promedio de una sección de la barra desde 
su posición de equilibrio x en el tiempo t. Las vibraciones pueden escribirse como una suma 
de vibraciones armónicas simples: 


víx,t)= Y jui (x) cos lt — to), 
k=0 


donde 


d du y А ЕР 
= potto] + Ако(х)ик(х) = 0. 


Si la barra tiene longitud / y está fija en sus extremos, entonces la ecuación diferencial se 
mantiene para 0 < x < l y v(0) = v(!) = 0. 


v(x) en un tiempo fijo t 


Un sistema de estas ecuaciones diferenciales recibe el nombre de sistema Sturm-Liouville 
y los números А son eigenvalores con eigenfunciones correspondientes u(x). 

Suponga que la barra es de 1 m de largo con rigidez uniforme p(x) = p y densidad uni- 
forme p(x) = p. Para aproximar u y А, sea h = 0.2. Entonces х; = 0.2j, para 0 < j < 5,y 
podemos usar la fórmula de punto medio (4.5) en la sección 4.1 para aproximar las primeras 
derivadas. Esto da el sistema lineal 


2 —1 (0) 0 У І ҮІ 

awad E О.о | | адд 
0 —1 2 —1 W3 p W3 p 
0 0 —1 2 W4 W4 
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En este sistema, w; ~ и(х;), paral< j < 4, y wo = ws = 0. Los cuatro eigenvalores 
de A aproximan los eigenvalores del sistema Sturm-Liouville. Es la aproximación de los 
eigenvalores que consideraremos en este capítulo. En el ejercicio 7 de la sección 9.5 se ana- 
liza una aplicación Sturm-Liouville. 


WEN .. Álgebra lineal y eigenvalores 


Los eigenvalores y los eigenvectores se presentaron en el capítulo 7 en relación con la con- 
vergencia de métodos iterativos para la aproximación de la solución de un sistema lineal. Para 
determinar los eigenvalores de una matriz A n X n, construimos el polinomio característico 


pO) = det(A — АГ) 


y, entonces, determinamos sus ceros. Encontrar el determinante de una matriz n X n es caro 
desde el punto computacional y hallar buenas aproximaciones para las raíces de p(à) también 
es difícil. En este capítulo exploraremos otros medios para aproximar los eigenvalores de 
una matriz. En la sección 9.6 damos una introducción a una técnica para la factorización 
de una matriz m X n en una forma que tiene aplicaciones valiosas en numerosas áreas. 

En el capítulo 7 encontramos que una técnica iterativa para resolver un sistema lineal 
convergerá si todos los eigenvalores asociados con el problema tienen magnitud menor que 
1. Los valores exactos de los eigenvalores en este caso no son muy importantes, sólo la 
región de un plano complejo en el que se encuentran. Un resultado importante en este sen- 
tido fue descubierto primero por S. A. Gersgorin. Es el tema de un libro muy interesante de 
Richard Varga [Var2]. 


Teorema 9.1 (Círculo de Ger3gorin) 


Semyon Aranovich Gersgorin Sea A una matriz n X п y R; denota el círculo en el plano complejo con centro а;; y radio 
(1901-1933) trabajó en el nal: es decir. 
Instituto Tecnológico de н lai;l; ? 
Petrogrado hasta 1930, cuando se 

mudó al Instituto de Ingeniería R = 
Mecánica de Leningrado. Su кт 
artículo de 1931 Über die 

Abgrenzung der Eigenwerte 

einer Matrix ([Ger]) incluía lo donde С denota el plano complejo. Los eigenvalores de A están contenidos en la unión de 
que se conoce como teorema del estos círculos, R = U!_¡R;¡. Además, la unión de cualquier К de los círculos que no cruzan 


чш el resto de (л — k), contiene precisamente k (multiplicidades contadas) de los eigenvalores. 


n 


lay] < у) 1410, 


j=1,jži 


тєС 


Demostración Suponga que A es un eigenvalor de A con un eigenvector asociado x, donde 
IIXlloo = 1. Puesto que Ах = Ax, la representación del componente equivalente es 


n 


Y ара, рага сада? = 1, 2,... „п. (9.1) 
j=1 
Sea k un entero con |хк| = IIxllo. = 1. Cuando і = k, la ecuación (9.1) implica que 


n 
› akjXj = АХ. 
j=1 


Por lo tanto, 


n 
› ах} = Ах — ах = (À — аш X o 


j=l, 
Ak 


Ejemplo 1 


Figura 9.1 
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y 
n n 
|А — arl + Ixl = |У аху < Y layli; 
j=l, j=1, 
¡A ¡Ak 
Pero, [хк] = IIXlloo = 1, por lo que |х;| < |х| = 1 para toda j =1,2,... ,n. Por lo tanto, 
п 
|А = an| < X` 1а]. 
j=l, 
JA 


Esto demuestra la primera afirmación en el teorema, que à € Rg. Una demostración se en- 
cuentra en [Var2], p. 8 o en [Or2], p. 48. ш 


Determine los círculos GerSgorin para la matriz 
4 1 1 
A= 0.2 1 
—2 0 9 
y úselos para encontrar los límites del radio espectral de A. 


Solución Los círculos en el teorema de GerSgorin son (consulte la figura 9.1) 
Ri = {z E€ C | |z -4| < 2}, № = {z E€ C | |z — 2| < 1}, y В = {z € C | |z — 9| < 2}. 


Puesto que R; y А están separados de Ёз, existen precisamente dos eigenvalores dentro de 
R¡ UR, y uno dentro de Кз. Además, p(A) = тах =; <з |^:|, por lo que 7 < р(А) < 11. m 


Eje 
imaginario 


Dos eigenvalores Un eigenvalor 


> Eje real 


Incluso cuando necesitamos encontrar los eigenvalores, muchas técnicas para su aproxi- 
mación son iterativas. La determinación de las regiones en las que se encuentran es el primer 
paso para hallar las aproximaciones porque nos da aproximaciones iniciales. 

Antes de considerar otros resultados concernientes a eigenvalores y a eigenvectores ne- 
cesitamos algunas definiciones y resultados del álgebra lineal. Todos los resultados generales 
que se requerirán en lo que resta de este capítulo se listan aquí para facilitar la referencia su 
consulta. Las demostraciones de muchos de estos resultados no proporcionados se conside- 
ran en los ejercicios y es posible encontrar todos en diversos textos estándar sobre álgebra 
lineal (consulte, por ejemplo, [ND], [Poo] o [DG]). 

La primera definición compara la definición de la independencia lineal de las funciones 
descritas en la sección 8.2. De hecho, mucho de lo que veremos en esta sección se compara 
con el material del capítulo 8. 
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Definición 9.2 


Teorema 9.3 


Definición 9.4 


Ejemplo 2 


Sea {у(), y 9, уЗ), ... , у} un conjunto de vectores. El conjunto es linealmente indepen- 
diente si, siempre que 


0 = оу? + оуб) + озу) gordi оцу), 


entonces, œ; = 0, para сайа і = 0, 1,... ,k.De lo contrario, el conjunto de vectores es 
linealmente dependiente. ш 


Observe que cualquier conjunto de vectores que contienen el vector cero es linealmente 
dependiente. 


Suponga que {v®, v®, v®,... ,v®} es un conjunto de n vectores linealmente indepen- 
dientes en R”. Entonces, para cualquier vector x € R”, existe un único conjunto de constan- 
tes В, B2,... , Bn con 


х = Bro + Ву?) + pro den BO. 


Demostración Sea А la matriz cuyas columnas son los vectores v®,v®,...,v™ . Enton- 
ces, el conjunto {v®, v®,..., у} es linealmente independiente si y sólo si la ecuación 
matricial 

A(0,0%,... , Œn) = 0 tiene la única solución (01,0%, ... , Æp) = 0. 


Pero, por el teorema 6.17 en la página 292, esto es equivalente a la ecuación matricial 
A(Bi, В, ..., Bn) = х, que tiene una única solución para cualquier vector x € R”. Esto, 
a su vez, es equivalente a la declaración de que para cualquier vector x € R”, existe un único 
conjunto de constantes Ву, В, ... , В, соп 


х = Ву) + Ву) + pro dial Bay. ш 


Cualquier conjunto де n vectores linealmente independientes еп R” recibe el nombre de base 
para R”. E 


a) Muestre que у!) = (1, 0, 0), v® = (-1,1, 1), y v® = (0, 4, 2) es una base para R°, y 
b) dado un vector arbitrario x € R°, encuentre 61, Вх y Ёз con 


О ОО 
Solución а) Sean о, о> y аз números соп 0 = олу?) + ооу?) + озуб). Entonces 
(0,0,0 = о (1,0,0), + о(—1, 1, 1) + аз(0, 4, 2) 
= (о — 02,92 + 403, 02 + 203)', 
porlo que ор 0 = 0, оо +403 = 0, у о +203 = 0. 


La única solución para este sistema es а = 0% = оз = 0, рог lo que este conjunto 
{у ©, yO, у) } de tres vectores linealmente independientes еп R? es una base para R°. 
b) Sea x = (x1, хо, x3)' un vector en R°. Resolviendo 


x= piv” + Ву? + Взуб) 
= В1(1,0,0)' + ›(—1,1,1)' + %((0, 4, 2) 
= (bı — Ba, Pa + 463, В + 283) 
es equivalente a resolver para В, В y Вз en el sistema 
Bi=B2=xX1, Pr+4B=x2, В +238 = хз. 
Este sistema tiene la solución única 


1 
bi = x1 — x2 + 2x3, В = 223 — x2 y Вз = 200 — хз). а 


Teorema 9.5 


Ejemplo 3 


Ejemplo 4 
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El siguiente resultado se usará en la sección 9.3 para desarrollar el método de potencia 
para aproximar los eigenvalores. En el ejercicio 12 se considera una prueba de este resultado. 


Si A es una matriz y A4¡,... , А son eigenvalores distintos de A con eigenvectores asociados 
x”, x®,... ,x®, entonces {x®, x®, ... , х} es un conjunto linealmente independiente. 
ш 


Muestre que se puede formar una base para R° usando los eigenvectores de la matriz 3 X 3 


2 0 
А = | 1 1 
=1 


wo 


Solución Еп el ejemplo 2 de la sección 7.2 encontramos que A tiene el polinomio caracte- 
rístico 


р) = р(А- М) = (А – 3)(А — 2°. 


Por lo tanto, existen dos eigenvalores distintos de A: Ау = 3 y А = 2. En ese ejemplo tam- 

bién encontramos que Ау = 3 tiene el eigenvector xı = (0, 1, 1)' y que hay dos eigenvecto- 

res linealmente independientes х› = (0, 2, 1) y хз = (—2, 0, 1)' correspondientes a л = 2. 
No es difícil mostrar (consulte el ejercicio 10) que este conjunto de tres eigenvectores 


(хт, хо, хз) = ((0, 1, 1), (0,2, 1), (72,0, 1) 


es linealmente independiente у, por lo tanto, forma una base para R°. п 


En el siguiente ejemplo observaremos una matriz cuyos eigenvalores son iguales a los 
del ejemplo 3, pero cuyos eigenvectores tienen un carácter diferente. 


Muestre que ningún conjunto de eigenvectores de la matriz 3 X 3 
2 1 0 
B=|0 2 0 
0 0 3 
puede formar una base рага R°. 
Solución Esta matriz también tiene el mismo polinomio característico que la matriz A en 


el ejemplo 3: 


X 1 0 
pà) = det 0 2—1 0 | = (0 —3)(0.— 2)°, 
0 0 3—ì 


3 


por lo que sus eigenvalores son iguales a los de A en el ejemplo 3, es decir, лу = 3 y А = 2. 
Para determinar los eigenvectores para B correspondientes al eigenvalor А = 3, nece- 
sitamos resolver el sistema (В — З/)х = 0, por lo que 


0 ХІ —1 1.0 Xi =X F х2 
(0) = (B == 3I) X2 = 0 -1 0 X2 — = 
0 Хз 0 0 0 X3 0, 


Por lo tanto, x2 = 0, х = х = 0 y x3 es arbitrario. Haciendo хз = 1 esto nos da el único 
eigenvector linealmente independiente (0, O, 1) correspondiente a лу = 3. 
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Definición 9.6 


Ejemplo 5 


Considerando А = 2. Si 


0 Ži 0 1 0 X1 х2 
0|=(B-2)| x2 |=|0 0 0|-| xa [= 0 |, 
0 X3 0 0 1 X3 Хз, 


entonces x2 = 0, хз = 0,у xı es arbitrario. Existe sólo un eigenvector linealmente inde- 
pendiente que corresponde а Аз = 2, lo que se puede expresar como (1, 0, 0), aun cuando 
А», = 2 fue un cero de multiplicidad dos del polinomio característico de B. 

Es claro que estos dos eigenvectores no son suficientes para formar una base para R°. 
En particular, (0, 1, 0) no es una combinación lineal de {(0, 0, 1), (1,0,0)J. п 


Ahora veremos que cuando el número de eigenvectores linealmente independientes no 
corresponde al tamaño de la matriz, como en el caso del ejemplo 4, existen dificultades con 
los métodos de aproximación para encontrar los eigenvalores. 

En la sección 8.2 consideramos los conjuntos ortogonales y ortonormales de funciones. 
Los vectores con estas propiedades se definen de forma similar. 


Un conjunto de vectores (y, v®, ... , v“”) recibe el nombre de ortogonal si (yv? у= 
0, para toda і % j. Si, además (v®)'v® = 1, para toda і = 1,2,...,n. Entonces el 
conjunto recibe el nombre de ortonormal. a 
Puesto que xXx = 11х15 para cualquier х еп R”, un conjunto de vectores ortogonales 
{00 yO, ...,v) es ortonormal si y sólo si 
[у |2 = 1, paracada ¡=1,2,...,n. 


a) Muestre que los vectores v® = (0, 4,2), v® = (—5, —1,2) y уб) = (1, —1,2) for- 
man un conjunto ortogonal y b) úselos para determinar un conjunto de vectores ortonor- 
males. 


Solución (а) Tenemos (vVyy% = 0(—5) + 4(—1) + 2(2) = 0, 
(у Фу'у® = 0(1) +4(—1) + 202) = 0, y (у®у'у® =-5(1) – 1(—1) +202) = 0, 


рог lo que los vectores son ortogonales у forman una base рага R”. Las normas l de estos 
vectores son 


[у = 22/5, Iv ll, =v30, y |У)» =vV6. 


b) Los vectores 


o _ vo | о 4 2 ) o 2/5 У} 
и = = > > = к^ E Vs 
у. 424/5 24/5 24/5 53 


oa / в ле 2 E ушу 
"=p Ll лю уш) \ 6 30° 15 | "У 


Ш т Т -1 2\'_{% М). 
ү (VE VE v6) \6° 6” 3 


forman un conjunto ortonormal ya que heredan la ortogonalidad a partir de у), v®, y уб). 
Además, 


1 2 3 
[ju = 190) = [а® |, = 1. п 
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La demostración del siguiente resultado se considera en el ejercicio 11. 


Teorema 9.7 Un conjunto ortogonal de vectores diferentes a cero es linealmente independiente. ш 


El proceso Gram-Schmidt para construir un conjunto de polinomios que son ortogo- 
nales respecto a la función de peso determinada se describió en el teorema 8.7 de la sección 
8.2 (consulte la página 383). Existe un proceso paralelo, también conocido como Gram- 
Schmidt, que nos permite construir una base ortogonal para R” dado un conjunto de п vecto- 
res linealmente independientes en R”. 


Teorema 9.8 Sea ([x¡,X2,... , X4} un conjunto de k vectores linealmente independientes en R”. Entonces 
[v1, V2, ... , ук) definido mediante 
Vi = X], 


k—1 А 
У;Хк 
Ук = Xx — › 7 Yi 
V; Vi 


i=1 


es un conjunto de k vectores ortogonales en R”. п 


La demostración de este teorema, que se analiza en el ejercicio 16, ез una verificación 
directa del hecho de que para cada 1 <i<kyl1< ¡<kyconi -# ¡, tenemos v;v;=0. 

Observe que cuando el conjunto original de vectores forma una base para R”, es decir, 
cuando k = n, entonces los vectores construidos forman una base ortogonal para R”. A partir 


de esto podemos formar una base ortonormal {u;, w2, ... ,u,) simplemente al definir para 
cadai=1,2,...,n 
Vi 
u; = A 
Пу 


El siguiente ejemplo ilustra cómo se puede construir una base ortogonal рага R° a partir 
de tres vectores linealmente independientes еп R°. 


Ejemplo 6 Use el proceso Gram-Schmidt para determinar un conjunto de vectores ortogonales a partir de 
los vectores linealmente independientes 


x® = (1,0,0), х0 = (1,1,0), y х® = (1,1,1). 


Solución Tenemos los vectores ortogonales у), ү?) у уб), dados рог 


0 =x07=(1,0,0) 
yO = (1,1, 0) (629 j (1,1,0) 
(01, 0, 0) (1, 0, 0y 


у® = (11,11 (1,0,0))'(1, 1, 1) (1,0,0) (00, 1,0)')' (1, 1, 1) (0.1.0) 
Б (1,0, 0)')* (1,0, 0) ЕЯ (00, 1,0) (0, 1,0)! У 


== (1, 1, 1y => (1,0,0y E (0, 1,07 = (0,0, 1 


) (1,0,0) = (1,1,0) — (1,0,0) = (0, 1,0) 


El conjunto {v®, v® , y) resulta ser tanto ortonormal, como ortogonal, pero comúnmente, 
ésta no es la situación. п 
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La sección Conjunto de ejercicios 9.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Definición 9.9 


Probablemente sería mejor 
llamar ortonormales a las 
matrices ortogonales porque las 
columnas no sólo forman un 
conjunto ortogonal de vectores 
sino también uno ortonormal. 


Teorema 9.10 


Ejemplo 1 


Matrices ortogonales y transformaciones de similitud 


En esta sección consideraremos la conexión entre los conjuntos de vectores y las matrices 
formadas usando estos vectores como sus columnas. Primero consideramos algunos resulta- 
dos alrededor de una clase de matrices especiales. La terminología en la siguiente definición 
sigue del hecho de que las columnas de una matriz ortogonal formarán un conjunto ortogonal 
de vectores. 


Se dice que una matriz О es ortogonal si sus columnas {q}, q5, . . . , 9} forman un conjunto 
ortonormal en К”. ш 


Las siguientes propiedades importantes de las matrices ortogonales se consideran en el 
ejercicio 19. 


Suponga que O es una matriz n X n ortogonal. Entonces 


i) Q es invertible con Q7! = O”. 
ii) Para cualquier x y y en R”, (Ox) Qy =X'y. 


iii) Para cualquier x en R”, ||Ox]l2 = ||x]l2. 


iv) Cualquier matriz invertible O con O”! = О' es ortogonal. п 


Como ejemplo, las matrices de permutación que se han analizado en la sección 6.5 
tienen esta propiedad, por lo que son ortogonales. 

A menudo, la propiedad iii) del teorema 9.10 se expresa al establecer que las matrices 
ortogonales preservan la norma l2. Como consecuencia inmediata de esta propiedad, todas 
las matrices ortogonales Q tienen || О||› = 1. 


Muestre que la matriz 


0 1D Y 

6 6 
(100 10 101 | 245 30 [v6 
Q = [u Ч ,U Ji 5 30 6 
Y5  yv30 Уб 

5 15 3 


formada a partir del conjunto ortonormal de vectores encontrado en el ejemplo 5 de la sec- 
ción 9.1 es una matriz ortogonal. 


Solución Observe que 


о A мб 0 245 М5 
6 6 5 5 1 0 0 
е 24/5 30 v6 v30 v30 30 = — 
00 = 5 30 6 6 30 15 = т =1 
{5 У v6 м6  _yY6 мб 
5 15 3 6 6 3 


Mediante el corolario 6.18 en la sección 6.4 (consulte la página 298), ésto es suficiente para 
garantizar que О' = Q 7”. Por ello, Q es una matriz ortogonal. п 


La siguiente definición establece las bases de muchas técnicas para determinar los ei- 
genvalores de una matriz. 


Definición 9.11 


Teorema 9.12 


Teorema 9.13 


Corolario 9.14 
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Se dice que dos matrices A y B son similares si existe una matriz no singular S con A = 
SBS. и 


Una característica importante de las matrices similares es que tienen los mismos eigen- 
valores. 


Suponga que A у B son matrices similares con А = 57! BS y А. es un eigenvalor de A con un ei- 
genvector x relacionado. Entonces 4 es un eigenvalor de В con un eigenvector relacionado Sx. 


Demostración Ѕеах % 0 tal que 
5-1В5х = Ах = Ах. 
Multiplicando а la izquierda por la matriz 5 da 
BSx = ASX. 


Puesto que x Æ 0 y 5 es no singular, 5х - 0. Por lo tanto, Sx es un eigenvector de B corres- 
pondiente a su eigenvalor А. a 


Un uso especialmente importante de similitud se presenta cuando la matriz A n X n 
es similar a la matriz diagonal, es decir, cuando existe una matriz diagonal D y una matriz 
invertible 5 con 


А =S7!DSo, de manera equivalente, D = SAS7!. 


El siguiente resultado no es difícil de mostrar. Se considera en el ejercicio 20 


Una matriz A n X п es similar a una matriz diagonal D si y sólo 51 A tiene n eigenvectores 
linealmente independientes. En este caso, D = 5-1 45, donde las columnas de S consisten 
en eigenvectores у el ¡-ésimo elemento diagonal de D es el eigenvalor de A que corresponde 
a la ¡-ésima columna de S. ш 


El par de matrices $ у D no es único. Por ejemplo, cualquier reordenamiento de las co- 
lumnas de $ y el reordenamiento correspondiente de los elementos de la diagonal de D darán 
un par distinto. Consulte el ejercicio 13 para una ilustración. 

En el teorema 9.5 observamos que los eigenvectores de una matriz que corresponden a 
los distintos eigenvalores forman un conjunto linealmente independiente. Como consecuen- 
cia, tenemos el siguiente corolario para el teorema 9.13. 


Una matriz A п X n que tiene n eigenvalores diferentes es similar a una matriz diagonal. в 


De hecho, no necesitamos que la matriz de similitud sea diagonal para que este concepto 
sea útil. Suponga que А es similar a la matriz triangular В. La determinación de los eigen- 
valores es fácil para una matriz triangular В, porque en este caso à es una solución para la 
ecuación 


0 = 4де(В — М) = [ [bi ) 
i=1 


si y sólo si А = Р; para algunas i. El siguiente resultado describe una relación, llamada 
transformación de similitud, entre las matrices arbitrarias y las triangulares. 
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Teorema 9.15 


Issai Schur (1875-1941) es 
conocido principalmente por su 
trabajo en la teoría de grupos, 
pero también trabajó en la teoría 
de números, el análisis y otras 
áreas. Publicó lo que se conoce 
como teorema de Schur en 1909. 


La norma l, de una matriz 
unitaria es /. 


Teorema 9.16 


Corolario 9.17 


(Teorema de Schur) 


Sea A una matriz arbitraria. Existe una matriz no singular U con la propiedad de que 
T = UAU, 


donde T es una matriz triangular superior, cuyas entradas diagonales consisten en eigenva- 
lores de A. ш 


La matriz U, cuya existencia está garantizada por el teorema 9.15, satisface la condición 
10х|| = ||x||2 para cualquier vector x. Las matrices con esta propiedad reciben el nombre 
de unitarias. A pesar de que no usaremos esta propiedad de preservación de la norma, sí 
aumenta significativamente la aplicación del teorema de Schur. 

El teorema 9.15 es un teorema de existencia que garantiza que existe la matriz Т, pero 
no proporciona un medio constructivo para encontrar T ya que requiere un conocimiento de 
los eigenvalores de A. En muchos casos, es demasiado difícil determinar la transformación 
de similitud U. 

El siguiente resultado para las matrices simétricas reduce la complicación porque, en 
este caso, la matriz de transformación es ortogonal. 


La matriz A п X n es simétrica si y sólo si existe una matriz diagonal D y una matriz ortogo- 
nal O con A = ODO". 


Demostración Primero suponga que А = ODO*, donde О es ortogonal y D es diagonal. 
Entonces 


A! (000) = (0')'DO' = ОРО! = A, 


у А es simétrica. 

Para demostrar que todas las matrices simétricas A se pueden escribir de la forma 
А = QDQ', primero considere los diferentes eigenvalores de A. Si Avı = Ау y Av, 
= A2v2,con А Æ Аз, entonces, puesto que A = A, tenemos 


Ол — А)у уо = (Ату) va — Vi (Ау) = (Av) v2 — Vi (Ау) = v Ava — у Ау = 0, 


рог lo que viv = 0. Por lo tanto, seleccionamos vectores ortonormales para diferentes 
eigenvalores simplemente al normalizar todos estos eigenvectores ortogonales. Cuando 
los eigenvalores no son distintos, habrá subespacios de eigenvectores para cada uno de los 
múltiples eigenvalores y con la ayuda del proceso de ortogonalización de Gram-Schmidt, 
podemos encontrar un conjunto completo de n eigenvectores ortonormales. п 


El siguiente corolario para el teorema 9.16 demuestra algunas de las propiedades más 
interesantes de las matrices simétricas. 


Suponga que А es una matriz simétrica п X п. Entonces existen п eigenvectores de A que 
forman un conjunto ortonormal y los eigenvalores de A son números reales. ш 


Demostración Si Q = (qij) у D = (dij) son las matrices especificadas en el teorema 9.16, 
entonces 


D=0'A0=0"'A0 implicaque AQ = ОР. 
Sea 1< i < ny Vi = (qii, Qi, --- , qni) la i-ésima columna de Q. Entonces 
Ау; = diiVi, 


y di; es un eigenvalor de A con eigenvector v;, la i-ésima columna de О. Las columnas de О 
son ortonormales, por lo que los eigenvectores de A son ortonormales. 
Al multiplicar esta ecuación a la izquierda por v; obtenemos 


v; АУ; = ану Vi. 


А veces, una matriz simétrica 
cuyos eigenvalores son todos 
números reales no negativos 
recibe el nombre de definida no 
negativa (o semidefinida 
positiva). 


Teorema 9.18 
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t РА A 
Puesto que У; Ау; y viv; son números reales y viv; = 1, el eigenvalor di; = vi Av; es un 
número real, рага cada i =1,2,...,n. ш 


Recuerde de la sección 6.6 que una matriz simétrica А es llamada definida positiva si 
para todos los vectores diferentes de cero, se tiene х' Ax > 0. El siguiente teorema caracteri- 
za a las matrices definidas positivas en términos de eigenvalores. Esta propiedad de eigenva- 
lor hace que las matrices definidas positivas sean importantes en las aplicaciones. 


Una matriz simétrica A es definida positiva si y sólo si todos los eigenvalores de A son po- 
sitivos. 


Demostración Primero suponga que А es definida positiva y que A es un eigenvalor de A con 
un eigenvector asociado х, con ||х||› = 1. Entonces 


0 < x Ax = Ах'х = А|х|2 = А. 


Para mostrar el recíproco, suponga que А es simétrica con еїгепуа1огез positivos. Por 
el corolario 9.17, A tiene п eigenvectores, У(!), v®,... ‚у, que forman un conjunto or- 
tonormal y, por el teorema 9.7, un conjunto linealmente independiente. Por lo tanto, para 
cualquier х % 0, existe un único conjunto de constantes diferentes de cero #1, B2,... , Bn 
para las que 


п 
х = 5 В:у®. 


i=] 


Al multiplicar por x' A obtenemos 


i=l isi j=1 і=1 


n n п п 
х'Ах = х! 5 BAYO | =x 5 &Мму®% | = 5 BB Py yO. 
J 


Pero los vectores у), y 9... , y“ forman un conjunto ortonormal, por lo que 
WD yO = 0, 5175], 
1, 61 ==® j 


Esto, junto con el hecho de que A; son todas positivas, implica que 


x Ах = УВ; (уу! yO = NY 18 >0. 


jel isl i=1 


Por lo tanto, A es definida positiva. п 


La sección Conjunto de ejercicios 9.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


P 9.3 El método de potencia 


El método de potencia es una técnica iterativa que se usa para determinar el eigenvalor 
dominante de una matriz (es decir, el eigenvalor con la mayor magnitud). Al modificar lige- 
ramente el método, también se puede usar para determinar otros eigenvalores. Una carac- 
terística útil del método de potencia es que no sólo produce un eigenvalor, sino también un 
eigenvector asociado. De hecho, a menudo, el método de potencia se aplica para encontrar 
un eigenvector para un eigenvalor que es determinado por algunos otros medios. 
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El nombre de método de potencia 
se deriva del hecho de que las 
iteraciones exageran el tamaño 
relativo de las magnitudes de los 
eigenvalores. 


Para aplicar el método de potencia, suponemos que la matriz n X n A tiene n eigenva- 
lores А, Ао, ... , Аһ, con un conjunto asociado de eigenvectores linealmente independientes 
{у , v, v®,..., у}, Además, suponemos que А tiene exactamente un eigenvalor А, 
que es más grande en magnitud, por lo que 


[24] > |A2] > (Аз > +++ > |А > 0. 
El ejemplo 4 de la sección 9.1 ilustra que una matriz n X n no necesita tener п еісепуесіогеѕ 


linealmente independientes. Cuando esto no es así, el método de potencia puede seguir sien- 
do exitoso, pero no se garantiza que lo sea. 


Si x es cualquier vector en R”, el hecho de que {v®, у), yG),..., v™®} es linealmente 
independiente implica que existen constantes #1, 82, ... , В, соп 
n 
X = 5 Ву? 
j=l 
Al multiplicar ambos lados de esta ecuación por A, A?,... , Аќ,... obtenemos 


п п 
Ах = Y 8400 ES NAAA A 2х = Es ‚Ду = эр AO, 
j=l j= 


y, en general, А*х = Y BjO. 
Si Af se factoriza a partir de cada término en el lado derecho de la última ecuación, 
entonces 


n 23 k 
АМУ (H) vo. 

| 1 

j=l 


Puesto que |Ал| > |A;|, para todas j =2,3,... ‚п, tenemos limo (Aj/MIY =0, y 
lím А*х = lím АУ“. (9.2) 
коо 


La sucesión еп la ecuación (9.2) converge a 0 si [31| < 1 y diverge si |Ал| > 1, siempre 
y cuando, por supuesto, $ + 0. Por consiguiente, las entradas en Ах aumentarán con k si 
А11 > 1 y tienden a0 si |Ал| < 1, tal vez, al resultar en desborde y subdesborde. Para cuidar 
esta posibilidad, escalamos las potencias de Ах en una forma apropiada para garantizar 
que la cota en la ecuación (9.2) es finita y diferente de cero. El escalamiento comienza al 


seleccionar х como vector unitario x® relativo a Il- || y seleccionar un componente 20 ае 
(0) 
x`” con 


ху = 1=х@© | 
Sea y® = Ах) y defina ш = PL Entonces 
тыл yo Е йиш + У. i Е Bw + УУ та 


ш = Ур = ROL 


g = v 
Хро (И + Уу Ё8;®ру biv + Уа 


Sea р el entero mínimo tal que 


yI = у? 1 


y defina x” mediante 


Ilustración 
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Entonces 
(9: р (1) 
x® = 1 = |x” ll% 
Ahora defina 
0) — Ax” 1 AxA 
y х = AX 
Ур 
y 


1 2 
Q) |: Ао) + >=. Bj»; 2 
ШО = у = Ур _ 


Е 7 Й 
Рі 0 | 


x n 0) а) 
Е [ҮЛ +) je BjAjU nr | / Ую 


mn fion + Уе ¿BOM 
Вов) + jas Ву AgaW 


Sea рә el entero más pequeño con 


2 2 
WOI = Te 
y defina 
1 1 1 
о) _ D D 200) 
Б ay -m Ах om Ax”. 
Y» Y» Ур» Урі 


De manera similar, defina las sucesiones de vectores {х(")}2 уу (y“J02_, y una suce- 


sión de escalares [J0_, de manera inductiva mediante 


y™ = AX (m— D 


(1) m D 
(т) __ (ту) __ ды 1 hd De 20.) AS ) Вур. (9 3) 
и S I Pma 1 n m—1 ИЛ ` 
Bi ор) 1 ПЕ У; =j /à1) В; UPm-1 
y 
(m) (0) 
qm) — y m A”x 


(т) т 


Урт П yo 


donde en cada paso, pm se usa para representar el entero más pequeño para el que 
(т) — ) 
У | = у loo 


Al examinar la ecuación (9.3), observamos que dado |А ;/А1| < 1, рага cada 
j=2,3,...,n,líM,»>0 Ш) = А, siempre y cuando x® se seleccione de tal forma que 
bı #0. Además, la sucesión de vectores (x?]_, converge para un eigenvector asociado 
con А que tiene norma læ igual a uno. 


La matriz 
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tiene eigenvalores à} = 4 y А = 1 con los eigenvectores correspondientes у = (1, —2)' 
y va = (1, —1). Si comenzamos con el vector arbitrario Xy = (1, 1) y multiplicamos por la 
matriz А, obtenemos 


—5 —29 —125 
x= Аю = || |. кю = Ах = | |. э = Аю = | = 


—509 —2045 —8189 
а | 1021 |. сша | 4093 | ү MALES | 16381 |. 


Como consecuencia, las aproximaciones para el eigenvalor dominante Ау = 4 son 


61 253 1021 

А? = — = 4.6923, л? = —— = 4.14754, л? = = = 4.03557, 
13 61 253 
4093 16381 

0 = = 4.00881, у А? = ——— = 4.00200. 
1021 4093 
. А . (5) 16381 
Un eigenvector aproximado correspondiente алг = 4093. = 4.00200 es 


—8189 ЖО Я 1 
X6 = | 16381 | , que, dividido entre —8189, se normaliza | -2.00037 | xX ү]. 


ш 

El método de potencia tiene la desventaja de que es desconocido al principio si la matriz 
tiene un solo eigenvalor dominante. Tampoco se conoce cómo x® debería seleccionarse para 
garantizar que su representación en términos de eigenvectores de la matriz contendrá una 
contribución diferente de cero de eigenvectores asociados con el eigenvalor dominante, si 


existiera. 
El algoritmo 9.1 implementa el método de potencia. 


Método de potencia 


Para aproximar el eigenvalor dominante y un eigenvector asociado de la matriz А п X п dado 
un vector x diferente a cero: 


ENTRADA dimensión п; matriz A; vector x; tolerancia TOL; número máximo de itera- 
ciones N. 


SALIDA aproximar el eigenvalor и; aproximar el eigenvector х (con ||х|| = 1) o un 
mensaje de que el número máximo de iteraciones fue excedido. 


Paso 1 Determine k = 1. 
Paso 2 Determine el entero más pequeño p con 1< p < пу |xp| = |х|. 
Paso 3 Determine x = x/xp. 


Paso 4 Mientras (k < N) haga los pasos 5-11. 
Paso 5 Determine y = Ах. 


Paso 6 Determine u = yp. 
Paso 7 Encuentre el entero más pequeño p con 1 < p <n y |yp| = yllo- 


Paso 8 Si y, = 0 entonces SALIDA (*Eigenvector”, х); 
SALIDA (А tiene el eigenvalor 0, seleccione un 
nuevo vector х y reinicie”); 


PARE. 
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Paso 9 Determine ERR = ||х — (y/yp)lloo; 
x= у/уь. 
Paso 10 Si ERR < TOL entonces SALIDA(, х); 


(El procedimiento fue exitoso.) 
PARE. 


Paso 11 Determine k = К + 1. 


Paso 12 SALIDA (‘El número máximo de iteraciones excedido”); 
(El procedimiento no fue exitoso.) 
PARE. ш 


Convergencia acelerada 


Al seleccionar, en el paso 7, el entero más pequeño pm para el que |у!) | = |у" |12 garanti- 
тата, en general, que al final este índice se vuelve invariante. La velocidad a la que { u™ Pii 
converge en А. se determina mediante los radios |À ;/à1 |”, para j = 2,3, ... , n, yen particu- 


lar por medio |à2/å1 |". La velocidad de convergencia es О (|А /А1 |”) (consulte [IK], р. 148), 
por lo que existe una constante k, de tal forma que para m grande, 


A m 
w ula [22 
|н 1l e 
lo cual implica que 
а. ТЫА... [А5 1 
тоо [ш А |м| 


La sucesión {и} converge linealmente а Ал, por lo que el procedimiento A? de Aitkens, 
que se analiza en la sección 2.5, se puede utilizar para acelerar la convergencia. Al imple- 
mentar el procedimiento A? en el algoritmo 9.1 se logra modificar el algoritmo de acuerdo 
con lo siguiente: 


Paso 1 Determine k= 1; 
ш = 0; 
ш = 0. 


Paso 6 Determine м = yp; 
ЕЯ (ш о)? _ 
ш — 241 + Ho 
Paso 10 Si ERR < TOL y К > 4 entonces SALIDA (Å, х); 
PARE. 


Paso 11 Determine k = k + 1; 
Ho = Ш; 
Шш = и. 


En la actualidad, no es necesario que la matriz tenga diferentes eigenvalores рага que el 
método de potencia converja. Si la matriz tiene un eigenvalor dominante único, А1, con mul- 
tiplicidad r superior a 1 y v», v®,...,v® son eigenvectores linealmente independientes 
asociados con А], el procedimiento seguirá convergiendo en А.у. En este caso, la sucesión de 
vectores (x]22_,, convergerá en un eigenvector de à; en la norma /,, igual a uno que de- 
pende de la selección del vector inicial х y es una combinación lineal де у), уб2),..., уй). 
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Ejemplo 1 


Tabla 9.1 


Use el método de potencia para aproximar el eigenvalor dominante de la matriz 


-4 14 0 
A=|-5 13 0 
—1 0 2 


y, a continuación, aplique el método A? de Aitkens para las aproximaciones para el eigenva- 
lor de la matriz para acelerar la convergencia. 


Solución Esta matriz tiene eigenvalores А = 6,42 = 3, y Аз = 2, por lo que el método 
de potencia descrito en el algoritmo 9.1 convergerán. Si x0) = (1, 1,1), entonces 


y" = Ах = (10, 8, 1), 
por lo que 


0) 
e] 


Пу =10, 9 шу = 10, y жол 


Al continuar de esta forma llegamos a los valores еп la tabla 9.1, donde 2) representa la 
sucesión generada por el procedimiento A? de Aitkens. Una aproximación para el eigenvalor 


m My ш? ГАС 

0 (11D 

1 (1,0.8,0.1) 10 6.266667 
2 (1,0.75, —0.111) 7.2 6.062473 
3 (1,0.730769, —0.188803) 6.5 6.015054 
4 (1, 0.722200, —0.220850) 6.230769 6.004202 
5 (1,0.718182, —0.235915) 6.111000 6.000855 
6 (1,0.716216, —0.243095) 6.054546 6.000240 
7 (1,0.715247, —0.246588) 6.027027 6.000058 
8 (1, 0.714765, —0.248306) 6.013453 6.000017 
9 (1,0.714525, —0.249157) 6.006711 6.000003 
10 (1,0.714405, —0.249579) 6.003352 6.000000 
11 (1,0.714346, —0.249790) 6.001675 
12 (1,0.714316, —0.249895) 6.000837 


dominante 6, en esta etapa es 010% = 6.000000. El eigenvector unitario /.,- aproximado 
para el eigenvalor 6 es (х(12))' = (1,0.714316, —0.249895). 

Aunque la aproximación para el eigenvalor es correcta para los lugares enumerados, la 
aproximación del eigenvector es considerablemente menos precisa para el eigenvector ver- 
dadero (1, 5/7, —1/4) ғ (1,0.714286, —0.25)'. а 


Matrices simétricas 


Cuando А es simétrica, es posible hacer una variación en la selección de los vectores 
х" y y y los escalares 1”? para mejorar significativamente el índice de convergencia de 
la sucesión [u”j2_, para el eigenvalor dominante А. De hecho, a pesar de que el índice 
de convergencia del método de potencia general es O(|A2/11|”), el índice de convergencia 


Ejemplo 2 
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del procedimiento modificado que se dio en el algoritmo 9.2 para las matrices simétricas es 
O(|A2/211?"). (Consulte [IK], р. 149 ff.) Puesto que la sucesión {и} sigue siendo conver- 
gente, también puede aplicarse el procedimiento A? de Aitkens. 


Método de potencia simétrica 


Para aproximar el eigenvalor dominante y un eigenvector asociado de la matriz simétrica 
n X n A, dado un vector diferente de cero x: 


ENTRADA dimensión n; matriz A; vector x; tolerancia TOL; número máximo de iteracio- 
nes N. 


SALIDA aproxime el eigenvalor и; aproxime el eigenvector x (con |х|; = 1) o un men- 
saje de que el número máximo de iteraciones fue excedido. 


Paso 1 Determine k = 1; 
x = х/||х||2. 
Paso 2 Mientras (k < №) haga los pasos 3-8. 
Paso 3 Determine y = Ах. 
Paso 4 Determine и = х'у. 


Paso 5 Si ly ll, = 0, entonces SALIDA (“Eigenvector”, х); 
SALIDA (А tiene un eigenvalor de 0, seleccione 
un nuevo vector x y reinicie”); 


PARE. 
Paso 6 Determine ERR = [x EA ; 
у» 112 
x = y/lly ll. 


Paso 7 Si ERR < TOL entonces SALIDA (и, х); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 8 Determine k = К + 1. 


Paso 9 SALIDA (“Número máximo de iteraciones excedido”); 
(El procedimiento no fue exitoso .) 
PARE. п 


Aplique tanto el método de potencia como el de potencia simétrica a la matriz 


4 —1 1 
A= —1 3 —2 > 
1 —2 3 


usando el método A? de Aitkens para acelerar la convergencia. 


Solución Esta matriz tiene eigenvalores А = 6, А = 3 y Аз = 1. Un eigenvector para el 
eigenvalor 6 es (1, —1, 1)“. La aplicación del método de potencia a esta matriz con vector 
inicial (1, 0, 0) da los valores de la tabla 9.2. 
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Tabla 9.2 
m (у); и“ АСД My con IX [| = 1 
0 (1,0, 0) 
1 (4,-1,1) 4 (1, —0.25,0.25) 
2 (4.5, —2.25, 2.25) 4.5 7 (1, —0.5, 0.5) 
3 (5, —3.5, 3.5) 5 62 (1, —0.7,0.7) 
4 (5.4, —4.5,4.5) 54 6.047617 (1, —0.8333, 0.8333) 
5 (5.666, —5.1666, 5.1666) 5.666 6.011767 (1, —0.911765, 0.911765) 
6 (5.823529, —5.558824, 5.558824) 5.823529 6.002931 (1, —0.954545, 0.954545) 
7 (5.909091, —5.772727, 5.772727) 5.909091 6.000733 (1, 0.976923, 0.976923) 
8 (5.953846, —5.884615, 5.884615) 5.953846 6.000184 (1, 0.988372, 0.988372) 
9 (5.976744, —5.941861, 5.941861) 5.976744 (1, —0.994163, 0.994163) 
10 (5.988327, — 5.970817, 5.970817) 5.988327 (1, —0.997076, 0.997076) 
Ahora aplicaremos el método de potencia simétrica a esta matriz con el mismo vector 
inicial (1, 0, 0). Los primeros pasos son 
x® = (1,0,0, Ax® = (4, —1, 1), МО =4, 
y 
D — ——— . Ax® = (0.942809, —0.235702, 0.235702). 
ПАх || 
Las entradas restantes se muestran en la tabla 9.3. 
Tabla 9.3 
m pay u™ em Amy con х || == 1 
0 (1,0,0) (1,0,0) 
1 (4,—1,1) 4 7 (0.942809, —0.235702, 0.235702) 
2 (4.242641, —2.121320, 2.121320 5 6.047619 (0.816497, —0.408248, 0.408248) 
3 (4.082483, —2.857738, 2.857738) 5.666667 6.002932 (0.710669, 0.497468, 0.497468) 
4 (3.837613, —3.198011, 3.198011) 5.909091 6.000183 (0.646997, 0.539164, 0.539164) 
5 (3.666314, —3.342816, 3.342816) 5.976744 6.000012 (0.612836, —0.558763, 0.558763) 
6 (3.568871, —3.406650, 3.406650) 5.994152 6.000000 (0.595247, 0.568190, 0.568190) 
7 (3.517370, —3.436200, 3.436200) 5.998536 6.000000 (0.586336, —0.572805, 0.572805) 
8 (3.490952, -3.450359, 3.450359) 5.999634 (0.581852, 0.575086, 0.575086) 
9 (3.477580, —3.457283, 3.457283) 5.999908 (0.579603, 0.576220, 0.576220) 
10 (3.470854, —3.460706, 3.460706) 5.999977 (0.578477, —0.576786, 0.576786) 


Теогета 9.19 


El método de potencia simétrica da una convergencia considerablemente más rápida 
para esta matriz que el método de potencia. Las aproximaciones del eigenvector en el méto- 
do de potencia converge en (1, —1, 1)”, un vector con norma unitaria en lœ. En el método 
de potencia simétrica, la convergencia es el vector paralelo (4/3/3, —vV3/3, 4/3/3)', que 
tiene la norma unitaria en /». 


Si à es un número real que aproxima un eigenvalor de una matriz simétrica A y x es un 
eigenvector asociado aproximado, entonces Ax— Ax es aproximadamente el vector cero. El 
siguiente teorema relaciona la norma de este vector para la precisión del eigenvalor À. 


Suponga que A es una matriz simétrica n X nconeigenvaloresA1,42,... „Àn. Si] AX—AXl|2 < € 


para algunos números reales à y vector x con ||х[|› = 1. Entonces 


mín |A;¡—A|<e. 


1<j<n 
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Demostración Suponga que У(!), v%, ..., у) forman un conjunto ortonormal de eigen- 
vectores asociados de A, respectivamente, con los eigenvalores А,Аз,...,Аһ. Median- 
te los teoremas 9.5 y 9.3, x se puede expresar, para algún conjunto único de constantes 


Ві, B2,-.. , Bn, como 
п 
x= УВ". 
ј=1 


Por lo tanto, 


2 
n n 
Ах – Ах||2 = (0 — »у%| = || — al? > А; = Al? |. 
Ах — Axl 2 ¿Dv 2181 laj АР = mín |у Al 281 
J= j Je у= 


Рего 


185? = 1х5 = 1, porloque е > |Ах – лх| > mín |A¿—A]. m 


1<ј<п 


Método de potencia inversa 


El método de potencia inversa es una modificación del método de potencia que da una 
convergencia más rápida. Se usa para determinar el eigenvalor de A que está más cerca de 
un número específico q. 
Suponga que la matriz А tiene eigenvalores A;,... , А, con eigenvectores linealmen- 
te independientes у(),... ,v™. Los eigenvalores de (А — q1)”', donde q % А, para 
= 1,2,...,n,son 


1 1 1 
№-4 №-9 "№-9 


> 


con estos mismos eigenvectores v”, у), ..., у. (Consulte el ejercicio 17 de la sección 
72.) 
Al aplicar el método de potencia a (A — q 1)! da 


ym = (A Z ja 


1 
(т) рае ВО та A, = 4)" v 1 


y 
(т) __ т) __ “Рт-1 __ 
Ш = у A ИШЕ n= 1 (О) > (9.4) 
2 Da 1 В; (А3 = 4)" T Орт 1 
y 
(m) 
к) _ у т 
(my? 
Урт 
donde, en cada paso, pm representa el entero más pequeño para el que | y] = [уб llo. La 


sucesión {и} en la ecuación (9.4) converge en 1/(Ax — q), donde 


ул © q + 1/u™ es el eigenvalor de A más cercano a q. 
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Conociendo k, la ecuación (9.4) se puede escribir como 
| Bo + Ум В, РЕЗИ yO | 
1 Pm-1 Sk J |у—4 Рт-—1 


— - lr (9.5) 
El + Zi В; Ва Uai 
JA 


ш") = 


Por lo tanto, la selección de q determina la convergencia, siempre y cuando 1/(A; — q) 
sea un único eigenvalor dominante de (A — 41)! (a pesar de que puede ser un eigenvalor 
múltiple). Mientras q está más cerca de un eigenvalor А, más rápida será la convergencia ya 


que la convergencia es de orden 
|" dq) |” 
ol |" D =o (|% q) К 
Ox =q)7 0—4) 


donde 4. representa el eigenvalor de А que es el segundo más cercano a q. 
El vector yl” se obtiene al resolver el sistema lineal 


(А—41)у°? =x., 


En general, se usa la eliminación gaussiana con pivoteo pero, como en el caso de la factori- 
zación LU, los multiplicadores se pueden guardar para reducir el cálculo. La selección de q 
puede basarse en el teorema del círculo de Geršgorin o en otros medios de localización de 
un eigenvalor. 

El algoritmo 9.3 calcula q a partir de una aproximación inicial para el eigenvalor х! 
mediante 


0) 


xO! 4x0) 
а= ORO * 


Esta selección de q resulta de la observación de que si x es un eigenvector de A respecto al 
eigenvalor A, entonces Ах = Ax. Por lo que, х' Ах = Ах'х у 


x Ax  X'AX 
= "ол: = 727 $ 
хх |х|5 
Si q está cerca de un eigenvalor, la convergencia sería bastante rápida, pero se debería usar 
una técnica de pivoteo en el paso 6 para evitar la contaminación por error de redondeo. 


A menudo, se usa el algoritmo 9.3 para aproximar un eigenvalor cuando se conoce un 
eigenvalor q aproximado. 


Método de potencia inversa 


Para aproximar un eigenvalor y un eigenvector asociado de la matriz A п X n, dado un vector 
х diferente de cero: 


ENTRADA dimensión n; matriz A; vector x; tolerancia TOL; número máximo de itera- 
ciones N. 


SALIDA aproxima el eigenvalor и; aproxima el eigenvector х (con ||Хх|| = 1) o un 
mensaje de que el número máximo de iteraciones fue excedido. 


x' Ax 


х'х 


Paso 1 Determine q = 


Paso 2 Determine К = 1. 
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Paso З Encuentre el entero más pequeño р con 1 < p < n y [xp] = IIXlloo. 
Paso 4 Determine x = x/xp. 
Paso 5 Mientras (k < N) haga los pasos 6-12. 

Paso 6 Resuelva el sistema lineal (A — q I )y = х. 


Paso 7 Si el sistema no tiene una solución única, entonces 
SALIDA (‘q es un eigenvalor”, q); 
PARE. 


Paso 8 Determine и = y». 
Paso 9 Encuentre el entero más pequeño p con 1< p <n y |yp| = |||. 


Paso 10 Determine ERR = |х = Yll 


х = y/yp. 
Paso 11 Si ERR < TOL entonces determine и = (1/1) + q; 
SALIDA (џи, х); 
(El procedimiento fue exitoso .) 
PARE. 


Paso 12 Determine k = К + 1. 


Paso 13 SALIDA (“Número máximo de iteraciones excedido”); 
(El procedimiento no fue exitoso .) 
PARE. ш 


La convergencia del método de potencia inversa es lineal, por lo que, de nuevo, el méto- 
do A? de Aitkens puede usarse para acelerar la convergencia. El siguiente ejemplo ilustra la 
rápida convergencia del método de potencia inversa si q está cerca de un eigenvalor. 


Ejemplo 3 Aplique el método de potencia inversa con x® = (1, 1, 1)' a la matriz 


MEETER 
= = con ==> GR 
_1 0 2 4 x (0): x (0) 3 


y use el método A? de Aitkens para acelerar la convergencia. 


Solución El método de potencia se aplicó a esta matriz en el ejemplo 1 usando el vec- 
tor inicial x® = (1, 1, 1). Éste nos dio el eigenvalor "2 = 6.000837 y el eigenvector 
(x02)" = (1,0.714316, —0.249895). 

Para el método de potencia inversa, consideramos 


э 14 0 
A-ql=| —5 2 0 
= 0 l3 


Con x® = (1, 1, 1), el método encuentra primero y” al resolver (A — q Г)у) = x®. Esto 
da 


w 33 24 84\' a 
у= | -=,= , == | = (56.6, -4.8, 1.292307692)'. 
5° 5°65 
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Tabla 9.4 


Teorema 9.20 


Por lo que 


1 
ly Dilo = 6.6, х) = =r = (1,0.7272727, —0.1958042)', 


1 19 
1 417 61818182. 
H 663 


Los resultados subsiguientes se incluyen en la tabla 9.4 y la columna derecha lista los resul- 
tados del método A? de Aitkens aplicado а u™ . Estos son resultados claramente superiores 


a los obtenidos con el método de potencia. п 
т хб)! u™ en 

0 (1,1,1) 

1 (1,0.7272727, —0.1958042) 6.1818182 6.000098 

2 (1,0.7155172, —0.2450520) 6.0172414 6.000001 

3 (1,0.7144082, —0.2495224) 6.0017153 6.000000 

4 (1,0.7142980, —0.2499534) 6.0001714 6.000000 

з (1,0.7142869, —0.2499954) 6.0000171 

6 (1,0.7142858, —0.2499996) 6.0000017 


Si А es simétrica, entonces, para cualquier número real q, la matriz (A—q.1)”' también 
es simétrica; por lo que el método de potencia simétrica, algoritmo 9.2, se puede aplicar a 
(A—q1)! para acelerar la convergencia en 
2m 
Ак = 
O TI 
A=q 


Métodos de deflación 


Existen numerosas técnicas para obtener aproximaciones para los otros eigenvalores de una 
matriz, una vez que se ha calculado una aproximación al eigenvalor dominante. Restringire- 
mos nuestra presentación a las técnicas de deflación. 

Las técnicas de deflación implican la formación de una nueva matriz B, cuyos eigenva- 
lores sean iguales a los de A, excepto que el eigenvalor dominante de A es reemplazado en 
B por el eigenvalor 0. El siguiente resultado justifica el procedimiento. La demostración de 
este teorema se puede encontrar en [Wil2], p. 596. 


Suponga que А, А, ... , А, son eigenvalores de A con eigenvectores asociados vD YY 
у) y Ау tiene multiplicidad 1. Sea x un vector con xv!) = 1. Entonces la matriz 


B=A-AvUx 


tiene eigenvalores 0, А, Аз,... , Àn con eigenvectores asociados v Y, w®, w®),... , w®, 
donde v® y w® están relacionados por medio de la ecuación 


уб = (А – А)мб +a awh), (9.6) 


рага сайа і = 2,3,..., п. ш 


Helmut Wielandt (1910-2001) 
trabajó originalmente en 
grupos de permutación, pero 
durante la Segunda Guerra 
Mundial se comprometió con la 
investigación en meteorología, 
criptología y aerodinámica. 
Esto implicaba problemas 

de vibración que requerían 

el cálculo de eigenvalores 
asociados con ecuaciones y 
matrices diferenciales. 


Ejemplo 4 
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Existen muchas selecciones para el vector x que podrían usarse en el teorema 9.20. 
La deflación de Wielandt inicia con la definición 


1 
= — py (4, aiz... din), (9.7) 
11; 
1 : : 
donde ví ) esuna coordenada diferente de cero del eigenvector y® y los valores a;¡, i2, ... , Qin 


son las entradas еп Іа i-ésima fila de A. 
Con esta definición, 


(1) 1 1 
(1411, 402, ... , ап], е ода 
Ау; 1“i j=1 
donde la suma es Іа ¡-ésima coordenada del producto Av”. Puesto que Av” = АУ(, 
tenemos 


п 


1 1 
Уау ) = А > 


j=l 


lo cual implica que 


х'у® = 101) = 1. 
Лу 0; 

Por lo tanto, х satisface la hipótesis del teorema 9.20. Además (consulte el ejercicio 25), 

la ¡-ésima fila de B = A — A: vVx' contiene completamente entradas cero. 

Si à Æ 0 es un eigenvalor con un eigenvector asociado w, la relación Bw = Аму implica 
que la ¡-ésima coordenada de w también debe ser сего. Por consiguiente, Іа ¡-ésima columna 
de la matriz В no contribuye al producto Bw = лу. Por lo tanto, la matriz B se puede reem- 
plazar con una matriz B’ (п — 1) x (n — 1) obtenida al eliminar la i-ésima fila y la ¡-ésima 
columna de B. La matriz B’ tiene eigenvalores Лә, A3,... , An. 

Si |A2] > |A3|, el método de potencia se aplica nuevamente a la matriz B’ para determi- 
nar este eigenvalor dominante y un eigenvector w®', asociado con Аз, respecto a la matriz 
B'. Para encontrar el eigenvector asociado w® para la matriz B, inserte una coordinada cero 
entre las coordenadas „2 yw o del vector (n — 1) dimensional 2” y, después, calcule 
уб) con la ecuación (9.6). 


La matriz 
4 —1 1 
A= | —1 3 —2 
1 —2 3 


tiene el eigenvalor dominante А = 6 con eigenvector unitario asociado v® =(1,-1, 1). 
Suponga que conocemos este eigenvalor dominante y aplique la deflación para aproximar 
los otros eigenvalores y eigenvectores. 


Solución El procedimiento para obtener un segundo eigenvalor А procede de acuerdo con 


lo siguiente: 
a 2 ian 
х= =1 = e т > 
6 1 3 6 6 


2 _1 І 

3 6 6 

(Det | 2 _1 1] | _2 1 =l 
YO X= 1 E S l= 3 6 6 |> 

2 1 1 

3 6 6 
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y 
2 1 1 
4 -1 1 з 76 6 о о о 
В= А- Мух = | -1 3 -2|-6|-3 ¿ -¿|=| 3 2 -1 
1 -—2 3 2 _1 1 —3 —1 
3 6 6 


Al eliminar la primera fila y la primera columna obtenemos 
2 -1 
55 
nm) 


que tiene eigenvalores Ао = 3 y Аз = 1. Para А = 3, el eigenvector wo” se puede obtener 
al resolver el sistema lineal 


(B'-31)w% = 0, queresultaen м0) = (1,-1). 


Al agregar un сего al primer componente obtenemos w® = (0, 1, —1)', y, a partir de la 
ecuación (9.6), tenemos el eigenvector v® de A correspondiente а x) = 3: 


v® = (А A JW + А aw) 


t 2 Е: t tio _ t 
= (3 — 6)(0, 1, —1) +5 (5-33) 01-1] а,-1,1) = (—2,—1,1). ш 


Aunque este proceso de deflación se puede usar para encontrar las aproximaciones рага 
todos los eigenvalores y eigenvectores de una matriz, el proceso es susceptible al error de 
redondeo. Después de usar la deflación para aproximar el eigenvalor de una matriz, la apro- 
ximación debería utilizarse como valor inicial para el método de potencia inversa aplicado a 
la matriz original. Esto garantizará la convergencia para un eigenvalor de la matriz original, 
no la de las matrices reducidas, que probablemente contiene errores. Cuando se requieren 
todos los eigenvalores de una matriz, deberían usarse las técnicas consideradas en la sección 
9.5, con base en transformaciones de similitud. 

Cerramos esta sección con el algoritmo 9.4, que calcula el segundo eigenvalor dominan- 
te y el eigenvector asociado para una matriz, una vez que se ha determinado el eigenvalor 
dominante y el eigenvector asociado. 


Deflación de Wielandt 


Para aproximar el segundo eigenvalor más dominante y un eigenvector asociado de la matriz 
Ап X n dada una aproximación А рага el eigenvalor dominante, una aproximación у para un 
eigenvector asociado у un vector x e R”7!: 


ENTRADA dimensión п; matriz A; eigenvalor А aproximado con eigenvector v € R”; 
vector x € R”7!; tolerancia TOL; número máximo de iteraciones N. 


SALIDA eigenvalor и aproximado; eigenvector aproximado u o un mensaje de que el 
método falla. 


Paso 1 Sea iel entero más pequeño соп 1 < i < n y |v;i| = тах, |0]. 
Paso 2 Sii Æ 1 entonces 
para k = 1,...,i— 1 
para j = 1,...,i— 1 
Uk 


determine Б; = akj = — dij. 
Vi 
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Paso 3 51 1-2 1у i п entonces 
para k =i,...,n— 1 
para j = 1,...,i—1 


К Uk+1 
determine bj = ak+1,j = —— aij; 
ü: 


1 
he 

j 

bjk = ар = ад: 
Vi 
Paso 4 Sii Ak п entonces 
para k =i,...,n— 1 
paraj = і,...,п– 1 


. 0+1 
determine bj; = ар, ры — a E 


1 
Paso 5 Realice el método de potencia en la matriz (n — 1) x (n — 1) B’ = (bj) con x 
como aproximación inicial. 


Paso 6 Si el método falla, entonces SALIDA (“El método falla”); 


PARE. 
si u es el eigenvalor aproximado 
w = (w;,... ,w!_¡)' el eigenvector aproximado. 
Paso 7 SiizZ 1 entonces рага k = 1,... ,i — 1 determine wg = w}. 
Paso 8 Determine w; = 0. 
Paso 9 Sii 5 п entonces para k =i + 1,... ‚п determine wg = и; |. 
Paso 10 Parak = 1,...,п 
2 v 
А k 
determine ug = (и — Уюк + aiw; | —. 
н Э HWI y 


j=1 
(Calcule el eigenvector con la ecuación (9.6).) 


Paso 11 SALIDA (и, и); (El procedimiento fue exitoso .) 
PARE. п 


La sección Conjunto de ejercicios 9.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


|] 9.4 Método de Householder 


En la sección 9.5 usaremos el método QR para reducir una matriz tridiagonal simétrica en una 
matriz similar que es casi diagonal. Las entradas diagonales de la matriz reducida son apro- 
ximaciones para los eigenvalores de la matriz dada. En esta sección presentamos un método 
concebido por Alston Householder para reducir una matriz simétrica arbitraria en una matriz 
tridiagonal similar. A pesar de que existe una conexión entre los problemas que estamos resol- 
viendo en estas dos secciones, el método de Householder tiene una aplicación tan amplia en 
áreas diferentes a la aproximación de eigenvalores que merece un trato especial. 

a и El método de Householder se usa para encontrar una matriz tridiagonal simétrica В 
realizó investigaciones en € 11 а . ЛИ А а A d El 9 16 . li A 
biología matemática antes de ser Ue es similar a una matriz simétrica c etermina а. teorema 9.16 implica que А es 
director del Laboratorio Nacional Similar a la matriz diagonal D, ya que existe una matriz ortogonal O con la propiedad de 
de Oak Ridge en Tennessee en que D = ОАО = Q' АО. Puesto que, en general, la matriz О (y por consiguiente, D) 
1948. Comenzó a trabajar en la es difícil de calcular, el método de Householder ofrece un compromiso. Después de haber 
solución de sistemas lineales en nl de el métodö:de Ë hold ibl ¿tod fici ial 
là década de 1950, cundo ss imp ementado e méto o de Householder, es posible usar métodos ef cientes, como el algo- 
desarrollaron estos métodos. ritmo QR, para aproximar con exactitud los eigenvalores de la matriz tridiagonal simétrica 

resultante. 


Alston Householder (1904-1993) 
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Definición 9.21 


Teorema 9.22 


Transformaciones de Householder 


Sea w € R” con ww = 1. Entonces la matriz n Хп 
P = I — 2ww' 
recibe el nombre de transformación de Householder. E 


Las transformaciones de Householder se usan para los bloques externos de entradas 
cero en vectores o columnas de matrices de manera en extremo estable respecto al error 
de redondeo. (Consulte [Wi12], pp. 152-162, para mayor análisis.) Las propiedades de las 
transformaciones se dan en el siguiente teorema. 


Si una transformación de Householder, Р = I — 2ww', es simétrica y ortogonal, entonces 
pap, 


Demostración 
(ww) = (муг) му" = ww' 
y de 
P'=(1-2ww') = I – 2ww' =P. 
Además, w'w = 1, por lo que 
РР! = (1 — 2ww') (I — 2ww') = I — 2ww' — 2ww' + 4wwww' 
= I —4ww' +4ww'= Г, 
уге = Р. п 


El método de Householder comienza determinando una transformación Р tal que 
АО) = PV APO tiene entradas ceros fuera de la primera columna de A, comenzando con la 
tercera fila, es decir, 


а) =0, рагасайа j =3,4,...,n. (9.8) 


с P di 2 
Por simetría, también tenemos а! г = 0. 

Ahora seleccionamos un vector w = (w1, W2, ... ,w,)' de tal forma que ww = 1, la 
ecuación (9.8) se mantiene y en la matriz 


А = РОАР( = (I — 2ww')A(I — 2ww), 


tenemos a =411 y da = 0, para сайа j =3,4,... ‚п. Esta selección impone n condi- 


ciones en los n valores desconocidos w¡,w2,... , Wn. 
Al establecer у = 0 garantizamos que ай) = ау. Queremos 


P® = I — 2ww' 
para satisfacer 
P™® (a11, а21,а31,... , an1) = (a11, œ,0,... ,0), (9.9) 
donde о se seleccionará más adelante. Para simplificar la notación, si 
Y = (W2, W3, ... ,Wn) ЄЙ" !, ӱ = (а1,а3,...,ап) ЄЙ" !, 
у Р es una transformación de Householder (n— 1) х (n-— 1) 


Р = 1,1 = 200". 
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Entonces, la ecuación (9.9) se convierte en 


ац 1: 0...... 0 бА 

421 СЕНИННИ | ai | Е | a 
РО | ai | - [0 : ОЕ 

: к A y Ру 0 

|, PELIT 


аһ 0 : 0 
con 
PY = (In-1 — 2WW09 = Y — 2(W9)W = (0, 0,... , 0). (9.10) 
Sea г = #'ў. Entonces 
(0,0, ...,0)' = (а — 2rw, азу = 2rWw3,... , ani —2rw,)Y, 


y podemos determinar todas las w; una vez que conocemos о y r. Al equiparar los compo- 
nentes da 


æ = азу — 2rw 


у 
0=aj – 2rw;, рагасайа ¡=3,...,n. 
Por lo tanto, 
2rw = aj —Q (9.11) 
y 
2rw;=A4j, paracada¡=3,...,n. (9.12) 


Al elevar al cuadrado ambos lados de cada una de las ecuaciones y sumar los términos 
correspondientes da 


п п 
2 2 2 2 
4r > и = (a — a) + У ал. 
j=2 j=3 


e ЕР п Za 
Puesto que ww = 1 уу! = 0, tenemos > j=2 Wi = 


4? = У a, – 20а +o’. (9.13) 
ј=2 


La ecuación (9.10) y el hecho de que Р es ortogonal implica que 
a? (0,0. ,0)(œ,0,... 07 = (ÊS) PS = FP PS = 9'9. 


Por lo tanto, 


з 
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Para garantizar 2r2=0 si y sólo si a21 = a31 = ··· = anı = 0, seleccionamos 


1/2 
п 


а = —80п(01) Уа, > 


j=2 


lo cual implica que 


1/2 
n п 


2r? = а + |921] Уа 
ј=2 j=2 
Con esta selección de о y 2r?, resolvemos las ecuaciones (9.11) y (9.12) para obtener 


da = Q ај В 
у= о рага сайа ¡=3,...,n. 


Para resumir la selección de Р“), tenemos 


1/2 
п 
2 
a. = —5рП(а2|) У, т 
j=2 
1 1 1/2 
r = | 70% — -aQ ; 
2 2 
м = 0, 
da] QA 
wa = A 
2r 
y 
ал A 
wj= э, por cada ¡=3,...,n. 
r 
Con esta selección 
Фао o 
Q) (2) (2) (2) 
Әр 45 аз = 4, 
0) — PPAP® = 0) 0) 0) 
А РАР О а чь al, 
(2) 02) 2 
0 а арз tos а) 
Al haber encontrado Р) y calculado А, el proceso se repite рага k =2,3,...,n—2 de 
acuerdo con lo siguiente: 
1/2 


п 
К) (k),2 
a = —звп(ар | Y (ау) |. 
j=k+1 


1 1 5 1/2 
r= (50 == 741 , 


w® =» =... =w” =0, 
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Ет 2r | 
Ж 
„(9 = сҮ рага cada ¡=k+2,k+3,...,n, 
Е 


PBP =] — 2y ® | (wey 


y 
А+ = РАЮ р 
donde 
a N Ооа ОО О E 0 
(+1) `t ` : 
Cai, : 
о Ban, a O ajenga i 0 
| ES IA 77+. (+1) (+1) 
as : UA бідні бада п 
“0 
(+1) ко 
Werner aa dana 0 app еУ at ) 


Si continuamos de esta manera, se forma la matriz tridiagonal y simétrica AD, donde 


А10 = pu-2) pin=3) НЕТИ РФ АР® т posa р(п-2). 


Ejemplo 1 Aplique las transformaciones de Householder а la matriz simétrica 4 X 4 


AA Е 
o| 12 0 1 
=] = 0 3 =2 
2 1 =2 =l 


para producir una matriz tridiagonal simétrica que es similar a A. 


Solución Para la primera aplicación de una transformación de Householder, 


a 1/2 А А T 
a=) | Уа, =, (у з= 01 з) = 6, 
ј=2 
[676 _v8 y6 
EN > 
1000 SN 0 
отоо 6 2 
po = 001.0 —2 (5) 1 ` (0, 2, =1, 1) 
0 0 0 1 1 
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1 оо о 
ү Жу 
2103 3 -5 
= 2 2 с о кл 
033 3 
Z TD 2 
00-33 3 
y 

43 0 0 

10 4 

aa- з 1 3 

= 5 4 

0 l 5-5 

4 4 

аа 


Al continuar con Ја segunda iteración, 


t 
2 
Шел ‚„— 2У?. w= (00.25. $) 


3 3 
10 0 0 
0 1 о 0 
Р) = Е |s 
0 0 -53 -5 Б 
4 3 
00-5 5 
y la matriz tridiagonal simétrica es 
4 -3 о o0 
10 5 
=< =; 0 
3 3 
е 5 в ав в 
3 25 75 
68 149 
о 0 75 F 


El algoritmo 9.5 realiza el método de Householder de acuerdo con lo que se describe 
aquí, a pesar de que se eluden las multiplicaciones reales de la matriz. 


Método de Householder 


Para obtener una matriz tridiagonal simétrica A" similar a la matriz simétrica А = AU, 
construya las siguientes matrices 
AD A®,..., AUD, donde А = (аў?) para cadak=1,2,...,n—1: 


ENTRADA dimensión п; matriz А. 


SALIDA А"). (En cada paso, A se puede sobreescribir.) 


Paso 1 Рагак = 1, 2,... ,п – 2 haga los pasos 2-14. 


Paso 2 Determine 


а= Y (a%y. 


j=k+1 
Paso 3 Si А = 0 entonces determine о = —q !/ 
112,00 
| р Pas 
si no determine q = o 7 
lares xl 


Paso 4 Determine RSQ = qu? — «а. (Nota: RSQ = 2r?) 
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Paso 5 Determine vg =0; (Nota: у = +- = у = 0, pero no necesaria.) 
k 
Шы = аё д = 4; 
Рага j = К+ 2,... , п determine vj = 


1 1 
(Mora: w = (75) = zv) 


1 n 
Paso 6 Paraj =k,k+1,... ,n determine uj = (о) 5 a® v. 


1 1 1 
si (Юл (ky — (k) 
(Nora: u= (о) А“ у = 24 У = 7A w.) 


n 


Paso 7 Determine PROD = 5 Vili. 
i=k+1 


1 
Nota: PROD = vu = —v Ау. 
2р2 


: . PROD 
Paso 8 Рага j = К,К + 1,..., п determine zj = uj — EJ üj: 
А 1 t 1... 
SEA UE NS = А 


1 1 
=u-—wwu= — Азу — ww' л.) 
r r 
Paso 9 Paral=k+1,k+2,...,n— 1 haga los pasos 10 y 11. 
(Nota: Calcule A“+D= А — yz! — zv' = (I — 2ww') А (I — 2ww').) 
Paso 10 Рага ј = 1 + 1,... ‚п determine 
н. СТИ 
== ¡ES йш; 
(k+1) (k+1) 
(+1) _ 
по = 


Paso 11 Determine a а? — 20121. 


Paso 12 Determine a+) = ab — 20,4. 


nn 


Paso 13 Para j = К+ 2,... ‚п determine a = ge =0. 


Paso 14 Determine а = а = Uk +1Zk5 


(+1) _ (+1) 
аркі = Ue 


(Nota: Los otros elementos de А! son iguales а A® ) 

Paso 15 SALIDA (AD); 
(El proceso está completo. А!) es simétrica, tridiagonal y similar a A.) 
PARE. п 


En la siguiente sección, examinaremos cómo se puede aplicar el algoritmo ОК para de- 
terminar los eigenvalores de AD, que son iguales а los de la matriz original А. 

El algoritmo de Householder se puede aplicar a una matriz arbitraria n X n, pero deben 
hacerse modificaciones para representar la posible falta de simetría. La matriz resultante 
A“=D no será tridiagonal a menos que la matriz original A sea simétrica, pero todas las 
entradas debajo de la subdiagonal inferior serán O. Una matriz de este tipo recibe el nombre 
de Hessenberg superior. Es decir, Н = (Л) es Hessenberg superior si h;; = 0, para toda 
і> ј +2. 
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Los siguientes pasos son las únicas modificaciones requeridas para matrices arbitrarias: 


1 n 
Paso 6 Para ј = 1, 2,... , п determine uj = =— аы; 
RSQ i=k+1 
ыс з б 
= ij Vi- 
RSQ i=k+1 
Я . PROD 
Paso 8 Para ¡=1,2,...,n determine zj = uj – 50° 
Paso 9 Рага l= к +1, К + 2,... ‚п haga los pasos 10 y 11. 
Paso 10 Рата ј = 1, 2,... ‚К determine a” == ай? = 230; 
k+1 k 
a = аў =ч 
Paso 11 Para ј = к + 1,... ‚п determine q = ай? —@ үш = уй. 


Después de modificar estos pasos, borre del 12 al 14 y la salida А “71. Observe que el paso 7 
permanece sin cambios. 


La sección Conjunto de ejercicios 9.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


ж 9.5 El algoritmo ОВ 


En general, los métodos de deflación que se han analizado en la sección 9.3 no son adecuados 
para calcular todos los eigenvalores de una matriz debido al crecimiento del error de redon- 
deo. En esta sección consideramos el algoritmo QR, una técnica de reducción de matriz que 
se usa para determinar en forma sistemática todos los eigenvalores de una matriz simétrica. 

Para aplicar el método QR comenzamos con una matriz simétrica en forma diagonal; es 
decir, las únicas entradas diferentes de cero se encuentran ya sea sobre la diagonal o sobre las 
subdiagonales directamente sobre la diagonal o por debajo de ella. Si ésta no es la forma de 
una matriz simétrica, el primer paso es aplicar el método de Householder para calcular una 
matriz tridiagonal simétrica similar a la matriz dada. 

En el resto de esta sección, se supondrá que la matriz simétrica para la que se calculan 
estos elgenvalores es tridiagonal. Si dejamos que A denote una matriz de este tipo, podemos 
simplificar la notación, en cierta medida, al etiquetar las entradas de A de acuerdo con lo 


siguiente: 
di de Mess 0 
ba a2 b3 : Е 
А= |0. b, а. 7. 0 |. (9.14) 
кзы ы Мы э. 
Dian 0 “ba in 


Si b2 =00b, = 0, entonces la matriz 1 X 1 [a¡]o [ a, ] produce de inmediato un eigenvalor 
a, о a, de A. El método ОК toma la ventaja de esta observación al disminuir sucesivamente 
los valores de las entradas por debajo de la diagonal principal hasta b 200 b, =0. 

Cuando b; = 0 para algunas j, donde 2< j < п, es posible reducir el problema para 
considerar, en lugar de A, las matrices más pequeñas 


Definición 9.23 


Si A es la matriz de rotación 2 X 2 
соѕ$9 — sen ө 

A= ё 
senó соѕб 

entonces Ах rota a х en el sentido 


contrario a las manecillas del 
reloj un ángulo 6. 


Ejemplo 1 


A menudo éstas reciben el 
nombre de rotaciones de Givens 
porque James Wallace Givens 
(1910-1993) las usó en la 
década de 1950 cuando estaba 
en los Laboratorios Nacionales 
Argonne. 
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а Б бесе 0 ар Бы Opee 0 
bo а А : Бер. йўл haa : 
0 b, a, O | у | 0. ba ашы `0 |. 049) 
+ бз ы. 30 ©. | ч 
Obviar 0 Б aja A 0 ba “A, 


Si ninguna Б; es cero, el método QR continúa al formar una sucesión de matrices 
A = А, А40), AG... ‚ de acuerdo con lo siguiente: 
i. AU = А se factoriza como producto de А) = QRO, donde Q” es ortogonal y 
R' es triangular superior. 


ii. А0) se define como AY = RV 0). 


En general, А se factoriza como un producto A® = О R® de una matriz ortogonal О y 
una matriz triangular superior А. Entonces, А!) se define mediante el producto de К? y Q® 
en dirección inversa А+) = RO QU). Puesto que Об es ortogonal, К = О AO, y 

AGD — ROJO = (040390 ЖЕ ОФ А® 0®. (9.16) 
Esto garantiza que А!) es simétrica соп los mismos eigenvalores que A”. Por la manera en 
que definimos О y КО, también garantizamos que А!) es tridiagonal. 
Al continuar mediante inducción, А!) tiene los mismos eigenvalores que la ma- 
triz original A, у АЎ) tiende a la matriz diagonal con los eigenvalores de A a lo largo de 
la diagonal. 


Matrices de rotación 


Para describir la construcción de las matrices de factorización 90 y RO, necesitamos la 
noción de matriz de rotación. 


Una matriz de rotación P difiere de la matriz identidad en máximo cuatro elementos. Estos 
cuatro elementos son de la forma 


рі = pj¡=<0s0 y рі = =ри = ѕеп Ө, 
para algunos Ө y algunas і Æ j. п 


Es fácil mostrar (consulte el ejercicio 12) que, para cualquier matriz de rotación Р, la 
matriz AP difiere de A sólo en la ¡-ésima y la ¡-ésima columnas y la matriz PA difiere de А 
sólo en la ¡-ésima y la j-ésima filas. Para cualquier і 4 j, el ángulo Ө se puede seleccionar de 
tal forma que el producto PA tiene una entrada cero para (P A);j. Además, todas las matrices 
de rotación Р son ortogonales porque la definición implica que РР! = 1. 


Encuentre una matriz de rotación P con la propiedad de que PA tiene una entrada cero en la 
segunda fila y la primera columna, donde 


3 1 0 
A=|1 3 1 
0 1 3 


Solución La forma de P es 


cosg sen 0 3 cos Ө + sen Ө cos + ЗѕепӨ send 
—sen cos 0 |, de modo que РА = | —3 sen + соѕ9 —– ѕепө +3cosð cos 
0 0 1 0 1 3 
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El ángulo Ө se selecciona de tal forma que —3 sen Ө + cos Ө = 0, es decir; de tal forma que 


1 
Ө = a Por lo tanto, 


ө 10 ө 10 
сов == 8919 = 0 
y 
510 ую 07[3 10 Мо 2/10 vio 
PA 2 =2 0 1 3 1 О švl0 v10 
0 0 1 0 1 3 0 1 3 
Observe que la matriz resultante no es ni simétrica ni diagonal. п 


La factorización de АЧ) сото А) = QWRÚ usa un producto de n — 1 matrices de 
rotación para construir 


R® = P, Pa BAS, 
Primero seleccionamos la matriz de rotación Р» con 


Pu = pu =cosh y рр = – р = sen bh, 


donde 
Ө b2 0 dı 
sen 02 = y cosh = ===. 
bi +a vbi + а? 
Esta selección da 
—b3a1 ajb> 
(— sen 0,)a + (cos 0,)b, = ale =0 


М +а2 ү +а? 


рага la entrada en la posición (2, 1), es decir, en la segunda fila y la primera columna del 
producto Р, А). Por lo que la matriz 


АЎ! = P A” 


tiene un cero en la posición (2, 1). 

La multiplicación Р, А) afecta ambas filas, 1 y 2 de A, por lo que la matriz А no 
necesariamente retiene cero entradas en las posiciones (1, 3) (1, 4),...,у (1, п). Sin em- 
bargo, A® es tridiagonal, por lo que (1, 4),..., (1, n) entradas de Af” también deben ser 0. 
Sólo la entrada (1, 3), la de la primera fila y la tercera columna, se puede volver diferente a 
cero en AP. 

En general, la matriz Р; se selecciona de tal forma que la entrada (k,k—1) en 
АЁ? = PLA), es cero. Este resultado en la entrada (k — 1,k + 1) se vuelve diferente de 
cero. La matriz А{? tiene la forma 
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AS 0 
ео ты чи : 
0. an : 
0 Zk-1 ts | : 
А? = 0 Xk Yk 0 : 
“з ыл айыз Биз a, `0 
ЗЫ, 
o Ed аһ 
y Рант tiene la forma 
Ik- 10) O 
Ck+1 Sk+1 < fila k 
Рап = O O 
=Sk+1 Ck+1 
4 O In-k-1 
1 
columna К 


donde O denota la matriz dimensional adecuada con todas las entradas сего. 
Las constantes скр = cos Ok+1 Y 5к+1 = sen Өү en Pz, se seleccionan de tal forma 
que la entrada (k + 1, k) en AU sea cero; es decir, —Sk+1Xk + скры = О. 


k+1 
2 2 _ Ил -s 
Puesto que сүү + т = 1, la solución de esta ecuación es 


Рт Xk 


5кы = су=———- у Ма 
ув + х \/ Бе ЕХ 


y АЁ), tiene la forma 


> 
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(9.17) 
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Ejemplo 2 


Si continuamos con esta construcción en la sucesión P»,... , Pa, obtenemos la matriz 
triangular superior 


Z. 4, та, (Йу ынын 0 
U S 

В = АФ = 
Pn—2 
Е 

(оойт Назиир КК Xn 


La otra mitad de la factorización QR es la matriz 
Т. 


debido a la ortogonalidad de las matrices de rotación implica que 


QURO ra (Pi PI е? Р!) (Р Ps Pa) АФ == AD. 


La matriz О? es ortogonal porque 
(oP oV = (РР; T PY (PP; Po) = (P, -- P3P») - AS kes Pr) = [. 


Además, Q™ es una matriz Hessenberg superior. Para observar porqué esto es verdad, puede 
seguir los pasos en los ejercicios 13 y 14. 

Por consiguiente, A® = RU QU también es una matriz Hessenberg superior porque al 
multiplicar О a la izquierda de la matriz triangular superior Ё no se afectan las entradas 
en el triángulo inferior. Ya sabemos que es simétrica, por lo que A? es tridiagonal. 

En general, las entradas fuera de la diagonal de АО), serán de magnitud más pequeña que 
las entradas correspondientes de АХ), por lo que АО) está más cerca de ser una matriz dia- 
gonal que Al”, El proceso se repite para construir А0), AW,... hasta obtener convergencia 
satisfactoria. 


Aplique una iteración del método QR a la matriz dada en el ejemplo 1: 
3 1 0 
A=|1 3 1 
0 1 3 


Solución Sea А) = A una matriz dada y Р» representa la matriz de rotación determinada 
en el ejemplo 1. Encontramos, por medio de la notación presentada en el método QR, que 


ЖЕ VO ivo M 


TO 3150 
(Шу. 0 _ МО 3/10 = 44/10  3v10 
те -0 w Y * , , 0 5 у 
0 0 1 0 1 3 
Z1 qı ГІ 
=|0 х y 
Оа 
Al continuar, tenemos 
pP X2 
з = === =0.36761 y бз = — === =().92998, 


д + py ү%+@ РУ 
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por lo que 
1 0 0 Ми м? 
R® = AP = PAP = | 0 0.92998 0.36761 q. ¿40 ¿uo 
0 —0.36761 0.92998 0 | a 
Мо ¿yo у 
=| 0 2.7203 1.9851 
0 O 2.4412 
у 
3/10 _ v0 
0 o 0 1 0 0 
09 = РР; = | E Y y 0 0.92998 —0.36761 
б ooi 0 0.36761 0.92998 


0.94868 —0.29409 0.11625 
= | 0.31623 0.88226 0.34874 


0 0.36761 0.92998 
Por consiguiente, 
Ло 24/10 уо 0.94868 —0.29409 0.11625 
АО = К000 = | 0 2.7203 1.9851 | | 0.31623 0.88226 0.34874 
0 0 2.4412 0 —0.36761 0.92998 


3.6 0.86024 0 
0.86024 3.12973 0.89740 
0 0.89740 2.27027 


Los elementos diagonales de А? son aproximadamente 14% más pequeños que los de AP, 
por lo que tenemos una reducción, pero no es considerable. Para disminuir por debajo de 
0.001, necesitamos realizar 13 iteraciones del método QR. Al hacerlo, obtenemos 


4.4139 0.01941 0 
AY = | 0.01941 3.0003 0.00095 
0 0.00095 1.5858 


Ésta daría un eigenvalor aproximado de 1.5858 y los eigenvalores restantes se podrían 
aproximar al considerar la matriz reducida 


4.4139 0.01941 
0.01941 3.0003 |: н 


Aceleración de la convergencia 


Si los eigenvalores de A tienen diferentes módulos con |А| > |A2] > --- > JAn], entonces la 
velocidad de convergencia de la entrada Br para 0 en la matriz А!) depende de la razón 


Aj+1/A;| (consulte [Fr]). La velocidad de convergencia de БТІ) рага 0 determina la veloci- 
JFL] : 8 ј+1 Р 


dad а Іа que la entrada an converge en el ¡-ésimo eigenvalor 4 ;. Por lo tanto, la velocidad 
de convergencia puede ser lenta si |5.у-1 /А ;| no es significativamente menor que 1. 

Para acelerar esta convergencia se usa una técnica de cambio similar a la que se usa 
con el método de potencia inversa en la sección 9.3. Se selecciona una constante с cerca del 
eigenvalor de A. Esto modifica Іа factorización en la ecuación (9.16) para seleccionar О y 
RO de tal forma que 


АФ 01 ОФК, (9.18) 


458 


CAPÍTULO 9 » Aproximación de eigenvalores 


Ejemplo 3 


y, por consiguiente, la matriz А7) está definida como 
AD — ROQO +01. (9.19) 


Con esta modificación, la velocidad de convergencia de ье? рага O depende de la razón 
[Ары —0)/(1;—0)]. Esto puede resultar en una mejora significativa sobre la velocidad 
original de convergencia de аў? para à; si о está cerca de A ;+1, pero no cerca de Àj. 

Cambiamos o en cada paso, de tal forma que cuando А tiene eigenvalores de diferentes 
módulos, b(4+1 converge a 0 más rápido que pra para cualquier entero j menor que n. 
Cuando Б) es suficientemente pequeño, suponemos que A, 5 а), elimina las ené- 
simas fila y columna de la matriz y continúa de la misma forma para encontrar una apro- 
ximación a 4,1. El proceso continúa hasta que se determina una aproximación para cada 
eigenvalor. 

La técnica de cambio selecciona, en el ¡-ésimo paso, la constante de cambio о;, donde о; 
es el eigenvalor de la matriz 


que está más cerca de а. Este cambio traduce los eigenvalores de A mediante un factor оў. 
Con esta técnica de cambio, normalmente la convergencia es cúbica. (Consulte [WR], p. 270.) 
El método acumula estos cambios hasta que РЁ +) ~ 0 y, después, añade cambios а afto 
para aproximar el eigenvalor Ал. | 

Si А tiene eigenvalores del mismo módulo, pon quizá tienda a 0 para algunas j Hna 
una velocidad más rápida que Р), En este caso, la técnica de división de matriz descrita 
en (9.14) se puede usar para reducir el problema a uno que incluya un par de matrices de 


orden reducido. 


Incorpore el cambio al método QR para la matriz 


[бою o] 
= | bP а? Ыр | Р 


3 1 
A=| 1 3 
0 1 0 po або 


шо -= о 


Solución Encontrar el parámetro de aceleración рага el cambio requiere encontrar los 
eigenvalores de 


que son шу = 4у и» = 2. La selección del eigenvalor más cercano а ar = 3 es arbitraria, 


y seleccionamos ио = 2 y cambiamos por esta cantidad. Entonces 01 = 2 y 


d bP 0 110 
ы” еер 1 
0 po ds 0 1 


Si continuamos con los cambios obtenemos 
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por lo que 
Y 2 E 
АЎ? о 0 2 
0 1 1 
Además, 
~, 
z=1, c3=0, з= 1, ф=1, y 12 == 
por lo que 
JZ М2 %4 
1 
RO=AP=| O 1 1 
v2 
0 0 = 
Para calcular А, tenemos 
~, /2 V2 
gam 2 =2 Б? = E, 1. 0-2, y aP =0, 
рог lo que 
[v2 
2 Y 0 
A = ROJO — 2 1 -4 
0 -2 0 


Una iteración del método ОК está completa. Ni pe = 2/2 ni bP = —y2/2 son peque- 
ñas, por lo que se realiza otra iteración del método QR. Para esta iteración, calculamos los 


eigenvalores 1 an 2/3 de la matriz 
а? bP 1 ња 
p > 0) Е Y 0 
p) = 0. Al completar los 


! = 143, el eigenvalor más cercano a а, 


y seleccionamos о» = 
cálculos, obtenemos 
2.6720277 0.37597448 0 
0.37597448 1.4736080 0.030396964 
—0.047559530 


Аб) = 
0.030396964 


0 


51 bO = 0.030396964 es suficientemente pequeño, entonces la aproximación del eigenva- 
lor Аз es 1.5864151, la suma de аз®) y los cambios ор + 07 = 2 + (1 — ~„3)/2. Al borrar 


la tercera fila y columna, obtenemos 
0.37597448 


1.4736080 


> 


до) — [ 26720277 
= | 0.37597448 


que tiene eigenvalores шу = 2.7802140 y u = 1.3654218. Al sumar los cambios obtene- 


mos las aproximaciones 
Лә 2 2.9993964. 


М 544141886 y 
Los eigenvalores reales de la matriz A son 4.41420,3.00000, y 1.58579, por lo que el método 
ш 


ОК dio cuatro dígitos significativos de exactitud en sólo dos iteraciones. 


El algoritmo 9.6 implementa el método QR. 
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Método ОВ 


Para obtener los eigenvalores de la matriz simétrica, tridiagonal n X n 


CN 0 
pD. DS o. ® 
А=А= | 0. 70 
| Е 50 
П ‚бей ьо ао 
ENTRADA n;al”,... „ай, ЫР... „ЬО; tolerancia TOL; número máximo de iteracio- 


nes M. 


SALIDA  eigenvalores de A, o la división recomendada de A o un mensaje que indica que 
el número máximo de iteraciones fue superado. 


Paso 1 Determine К = 1; 
SHIFT = 0. (Cambio acumulado.) 


Paso 2 Mientras k < M haga los pasos 3-19. 
Prueba de los pasos 3—7 para éxito.) 


Paso 3 Si |[bW] < TOL entonces determine А = а + SHIFT; 
SALIDA (А); 
determine n =n — 1. 
Paso 4 Si [20| < TOL entonces determine А = a” + SHIFT, 
SALIDA (А); 
determine n = п — 1; 


a® E a®; 
paraj = 2,...,п 
determine а? = а) ; 
po —ь%® 
j Ј+1 


Paso 5 Sin = 0 entonces 
PARE. 
Paso 6 Sin = 1 entonces 
determine А = a? + SHIFT, 
SALIDA (А); 
PARE. 


Paso 7 Paraj=3,...,n—1l 
si 10%] < TOL entonces 
SALIDA (dividido en”, a, Е ‚а q e po 


jo jalo 
y”, 

A a 

PARE. 


Paso 8 (Calcule el cambio.) 
Determine b = — (а, + а); 


k) „ (k) 012. 
с =а®а®, – [po]: 


d = (b? — 40). 
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Paso 9 Sib > 0 entonces determine ш = —2c/(b + d); 


u2 = —(b + d)/2 
si no determine ш = (4 — b)/2; 
ш = 2с/(4 — b). 


Paso 10 Sin = 2 entonces determine A, = ш + SHIFT, 
А = m + SHIFT, 
SALIDA (А, А); 
PARE. 
Paso 11 Escoja ø por lo que |o — a®| = mín(|, — a® |, [ио — a® |}. 
Paso 12 (Acumule el cambio.) 
Determine SHIFT = SHIFT + с. 
Paso 13 (Realice el cambio.) 
Paraj = 1,..., п, determine dj = af? —o. 
Paso 14 (Los pasos 14 y 15 calculan К“) 
Determine xı = 4\; 
yı = Б. 
Paso 15 Paraj=2,...,n 


1/2 
: 2 (7? 
determine 2/1 = хӯ + [ў | Н 


Xj-1 
Zj-1 
pP 
Oj = ——; 
<]-1 


qja =CjYja1 +830); 
xj = =0jYj1 + cjdj; 
Si j Æ n entonces determine ғ; = А. 
(k) 
у= с. 
(л = P; A% se acaba de calcular y RO = А.) 


Paso 16 (Pasos 16-18 calcule A'*+! .) 
Determine zn = Xp; 


k+1 
aj = 0241 + С221; 
+1 
[24 = 0222. 
Paso 17 Рага ј = 2,3,...,п – 1 
| +1 
determine af = Oj+1qj + CjCj4 1255 
(k+1) 
biyi = Oj41Z 410 


Paso 18 Determine a*+D = с„г„. 
Paso 19 Determine k = k + 1. 


Paso 20 SALIDA (“el número máximo de iteraciones excedido”); 
(El procedimiento no fue exitoso.) 
PARE. 


Se puede usar un procedimiento similar para encontrar las aproximaciones para los 
eigenvalores de una matriz simétrica n X n. Primero, la matriz se reduce a una matriz 
Hessenberg superior similar mediante el algoritmo de Hessenberg para matrices no simétri- 
cas, descrito al final de la sección 9.4. 
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James Hardy Wilkinson 
(1919-1986) es mejor conocido 
por su amplio trabajo sobre 
métodos numéricos para resolver 
sistemas de ecuaciones lineales 
y problemas de eigenvalor. 
También desarrolló la técnica 

de álgebra lineal numérica de 
análisis de error regresivo. 


El proceso de factorización QR asume la siguiente forma. Primero, 
H = НО = ОФК. (9.20) 
Entonces H® se define por medio de 
HË = ROD QV (9.21) 
y se factoriza en 
но = QPRO., (9.22) 


El método para factorizar continúa con el mismo objetivo que el algoritmo QR para ma- 
trices simétricas. Es decir, las matrices se seleccionan para introducir ceros en las entradas 
adecuadas de la matriz y se usa un procedimiento de cambio similar al del método QR. Sin 
embargo, el cambio es, en cierta medida, complicado para las matrices no simétricas ya que 
pueden presentarse eigenvalores complejos con el mismo módulo. El proceso de cambio mo- 
difica los cálculos en las ecuaciones (9.20), (9.21) y (9.22) para obtener el método QR doble 


go = 011 = QURO HË = RV QV +01 
н? = 01 = о? RO н) НА RË QË +01 
donde o; y о» son conjugados complejos y H®, НО), ... son matrices Hessenberg superior. 


Es posible encontrar una descripción completa del método QR en los trabajos de Wil- 
kinson [Wil2]. Algoritmos y programas detallados para éste y otros métodos que se usan con 
mayor frecuencia se proporcionan en [WR]. Remitimos al lector hacia estos trabajos si el 
método que hemos analizado no arroja resultados satisfactorios. 

El método QR se puede realizar de forma que producirá los eigenvectores de una matriz, 
así como eigenvalores, pero el algoritmo 9.6 no se ha diseñado para lograr esto. Si se nece- 
sitan los eigenvectores de una matriz simétrica, así como los eigenvalores, sugerimos que se 
use ya sea el método de potencia inversa después de haber utilizado los algoritmos 9.5 y 9.6 
o una de las técnicas más poderosas mencionadas en [WR]. 


La sección Conjunto de ejercicios 9.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


9.6 Descomposición en valores singulares 


En esta sección, consideramos la factorización de una matriz general А т X п en lo que se 
conoce como descomposición en valores singulares. Esta factorización toma la forma 


A=USV', 


donde U es una matriz ortogonal m X m, V es una matriz ortogonal n X n y S es una matriz 
m X n, cuyos elementos diferentes de cero se encuentran a lo largo de la diagonal principal. 
En esta sección supondremos que m > n, y, en muchas aplicaciones importantes, m es mucho 
más grande que л. 

La descomposición en valores singulares tiene una historia bastante larga, los matemá- 
ticos la consideraron por primera vez a finales del siglo хіх. Sin embargo, sus aplicaciones 
importantes tuvieron que esperar hasta que la potencia computacional estuviera disponible 


Definición 9.24 


Teorema 9.25 


Teorema 9.26 
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en la segunda mitad del siglo xx, cuando los algoritmos pudieron desarrollarse para su imple- 
mentación eficiente. Éste fue el trabajo principal de Gene Golub (1932-2007) en una serie de 
artículos en las décadas de 1960 y 1970. (Consulte, en especial, [GK] y [GR].) Una historia 
bastante completa de la técnica puede encontrarse en el artículo de G. W. Stewart, que está 
disponible por medio de internet en la dirección provista en [Stew3]. 

Antes de continuar con la descomposición en valores singulares, necesitamos describir 
algunas propiedades de las matrices arbitrarias. 


Sea A una matriz m X n. 


i) El rango de A, que se denota rango(4), es el número de filas linealmente indepen- 
dientes en A. 


ii) La nulidad de A, que se denota nulidad(A), es n — rango(A) y describe el conjunto 
más grande de vectores linealmente independientes v еп R” para el que Av = 0. m 


El rango y la nulidad de una matriz son importantes para caracterizar la conducta de la 
matriz. Cuando la matriz es cuadrada, por ejemplo, es invertible si y sólo si su nulidad es 0 y 
su rango es igual al tamaño de la matriz. 

El siguiente es uno de los teoremas básicos en álgebra lineal. 


El número de filas linealmente independientes de una matriz A m X n es el mismo número 
de columnas linealmente independientes de A. п 


Necesitamos considerar las dos matrices cuadradas relacionadas con la matriz A т X n, 
concretamente, la matriz A'A m X п y la matriz AA”. 


Sea A una matriz m X n. 
i) Las matrices A'A y AA' son simétricas. 
ii) Nulidad(A) = Nulidad(A' A). 
iii) Капоо(А) = Rango(A' A). 
iv) Los eigenvalores de А“ А son reales y no negativos. 
v) Los eigenvalores diferentes de cero de АА' son iguales a los eigenvalores de A' A. 


Demostración i) Puesto que (А' AY = А'(А^' = A' A, esta matriz es simétrica, y, de igual 
forma, lo es AA”. 
ii) Sea v Æ 0 un vector con Av = 0. Entonces 


(А' А)у = A' (Av) = А'0 = 0, porloque nulidad(A) < Nulidad(A' A). 
Ahora suponga que v es un vector n X 1 con А“ Ау = 0. Entonces, 
0 = у' A' Ау = (Av) Ау = ||Ау||2, lo cual implica que Av = 0. 


Por lo tanto, Nulidad(4* A) < Nulidad(A). Por consiguiente, Nulidad(A* А) = 
Nulidad(4). 


iii) Las matrices A y A' A tienen n columnas y sus nulidades concuerdan, por lo que 


Вапво(А) = п — Nulidad(4) = n — Nulidad (4* А) = Rango(A' А). 
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iv) Las matrices А“ A y AA' son simétricas mediante la parte i), por lo que el corolario 
9.17 implica que sus eigenvalores son números reales. Suponga que v es un eigen- 
vector de A' A con ||v||2 = 1 asociado al eigenvalor А. Entonces 


0 < [| Ау||; = (Av) (Ау) =у' А“ Ау = у'(А' Ау) = у (лу) = Ау'у = АУ = А. 


La demostración de que los eigenvalores de АА! son по negativos sigue la de- 
mostración de la parte v). 


v) Sea у un eigenvector correspondiente al eigenvalor diferente de cero de A'A. Enton- 
ces 


А! Ау = Ау  implicaque (AA')Av = Av. 


Sea Ау = 0, entonces, А' Ау = А'0 = 0, lo cual contradice la suposición de que 
à 0. Por lo tanto, Av О y Av es un eigenvector de A А' relacionado con À el recí- 
proco también sigue este argumento porque si à es un eigenvalor diferente de cero 
de АА! = (А')' А", entonces A también es un eigenvalor de А'(А')' = A'A. ш 


En la sección 5 del capítulo 6 observamos qué tan efectiva puede ser la factorización al 
resolver los sistemas lineales de la forma Ax = b cuando la matriz A se usa en forma repetida 
para variar b. En esta sección consideraremos una técnica para factorizar una matriz general 
m X n. Tiene aplicaciones en muchas áreas, incluyendo el ajuste de datos por mínimos cua- 
drados, la compresión de imágenes, el procesamiento de señal y la estadística. 


Construcción de una descomposición en valores singulares 
para una matriz А т х n 


Una matriz no cuadrada A, es decir, con un número diferente de filas y columnas, no puede 
tener un eigenvalor porque Ax y x serán vectores de diferentes tamaños. Sin embargo, existen 
números que desempeñan funciones para las matrices no cuadradas que son similares a las 
representadas por los eigenvalores para las matrices cuadradas. Una de las características 
más importantes de la descomposición en valores singulares de una matriz general es que 
permite una generalización de eigenvalores y eigenvectores en esta situación. 

Nuestro objetivo es determinar una factorización de la matriz А m X n, donde т > n, 
en la forma 


A=USV', 


donde U es una matriz ortogonal m X m, Ves una matriz ortogonal n X n y S es una matriz 
diagonal m X n; es decir, sólo entradas diferentes de cero (S); = s; > 0, parai =1,...,n. 
(Consulte la figura 9.2.) 


Á U S 
Е Е Е columnas и 


columnas и columnas т columnas и 


Definición 9.27 


Ejemplo 1 
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Construcción de 5 en la factorización A = U SV! 


Construimos la matriz $ al encontrar los eigenvalores de la matriz simétrica A'A n X n. Estos 
eigenvalores son todos números reales no negativos, los ordenamos de mayor a menor y los 
denotamos mediante 
ү >з) >> 5 > Skyl =з = Sa =O. 
+ 2 A 4 ~ . Р 
Es decir, con Sí denotamos el eigenvalor más pequeño diferente de cero de A'A. Las raíces 


cuadradas positivas de estos eigenvalores de A'A dan las entradas diagonales en S. Reciben 
el nombre de valores singulares de A. Por lo tanto. 


si Do... 0 
0 52 : 
E 0 
5= |0 0 os | 
0 0 
O se als ЧЮ 


donde s; = 0 cuando k <i <n. 


Los valores singulares de una matriz A m X n son las raíces cuadradas positivas de los 
eigenvalores diferentes de cero de la matriz simétrica A' A n X n. п 


Determine los valores singulares de la matriz 5 X 3 


1.0 1 

0.1.0 

A=|0 1 1 

0 1 0 

110 

Solución Tenemos 

1000 1 2 11 
A=|0 1 1 1 1 |, porloque A4A=| 1 4 1 
10100 1 1 2 


El polinomio característico de A' A es 


aso 33 — 832 + 17). — 10 = (3. — 5)(3. — 2). — 1), 


por lo que los eigenvalores de A' A son Ај = s? = 5,4 = s = 2, y à} = s? = 1. Por 
consiguiente, los valores singulares de A son sı = v5, s2 = vV2, y s3 = 1 y en la descom- 
posición en valores singulares de A, tenemos 


0 
/2 


М5 
0 
$=| 0 0 
о о 
о 0 


ооно о 
и 
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Cuando A es una matriz simétrica n X п, todas las 52 son eigenvalores de А? = A'A, 
y éstos son cuadrados de los eigenvalores de A. (Consulte el ejercicio 17 de la sección 7.2.) 
Por lo que en este caso, los valores singulares son los valores absolutos de los eigenvalores 
de A. En el caso especial cuando A es definida positiva (o incluso definida no negativa), los 
eigenvalores y valores singulares de A son los mismos. 


Construcción de V en la factorización A = US V‘ 
La matriz A'A n X n es simétrica, por lo que el teorema 9.16 en la sección 9.2 (consulte la 
página 430), tenemos una factorización 


AA=VDV', 


donde D es una matriz diagonal cuya diagonal consiste en eigenvalores de A'A y V es una 
matriz ortogonal cuya ¡-ésima columna es un eigenvector con norma 1 l asociado al eigen- 
valor de la ¡-ésima diagonal de D. La matriz diagonal específica depende del orden de los 
eigenvalores a lo largo de la diagonal. Seleccionamos D de tal forma que se escribe en orden 
decreciente. Las columnas, denotadas у], v$, ... ‚у, de la matriz ortogonal V n X n son 
eigenvectores ortonormales correspondientes a estos eigenvalores. Múltiples eigenvalores de 
A'A permiten diversas selecciones de eigenvectores correspondientes, por lo que a pesar 
de que D está definida de manera única, la matriz V podría no estarlo. Sin embargo, no hay 
problema ya que podemos seleccionar cualquier V. Puesto que todos los eigenvalores de A'A 
son no negativos, tenemos di; = e paral <i <n. 


Construcción де U en la factorización А = U S V‘ 

Para construir la matriz U m X m, primero consideramos los valores diferentes de 
cero 5) > у) >... > sk > 0 y las columnas correspondientes еп V determinadas por 
Vi, V2,... ‚Ук. Definimos 


1 
и; = —Ау;, parai=1,2,...,k. 


1 


Las usamos сото la primera k de las m columnas de U. Puesto que А es m X n y cada у;еѕ 
п X 1,el vector и; ез т X 1, según lo requerido. Además, para cada 1< і < ky1< j <k, 
el hecho es que los vectores V1, У2,... , Vn son eigenvectores de A'A que forman un conjunto 
ortonormal implica que 


t “o. А 

1 1 1 Sj О 581%], 

uu; = | —Av; | — Avj = —v¡A Avj = —vis v; = viv; = a 
Si Sj SiS; SiS; Si 1 sii=J. 


Por lo que, las primeras k columnas de U forman un conjunto ortonormal de vectores en R”. 
Sin embargo, necesitamos columnas adicionales m — k de U. Para esto, primero necesitamos 
encontrar los vectores m — k que, cuando se añadan a los vectores a partir de las primeras k 
columnas, nos darán un conjunto linealmente independiente. Entonces, podemos aplicar el 
proceso Gram-Schmidt para obtener las columnas adicionales adecuadas. 

La matriz U no será única a menos que k = m y entonces sólo si todos los eigenvalores 
de A'A son únicos. La no singularidad no es preocupante; sólo necesitamos una matriz U de 
este tipo. 


Verificación de la factorización А = U S V‘ 

Para verificar que este proceso en realidad da la factorización A = U SV‘, primero recorde- 
mos que la transpuesta de una matriz ortogonal también es la inversa de la matriz (consulte 
la parte (1) de la sección 9.1 del teorema 9.10 en la página 428). Por lo tanto, para mostrar 
A = USV', podemos mostrar la declaración equivalente AV = US. 
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Los vectores У], V2, ... , Vn forman una base para R”, Ду; = 5;0;, parai = 1,..., Е, 
y Av; = 0, parai = k + 1,... ‚п. Sólo las primeras k columnas de U producen entradas 
diferentes de cero en el producto US, por lo que tenemos 


AV = А [у V2 ++ Vk Vk+1 СС Va] 
= [Ауу Av +++ Ау; Ау c+: Ау, ] 


= [510 $202 560; 0 +0] 


si 0 о о 0 
к ; 
= [шш ---u¿0 ---0] | y 0 A 0 o | =US. 
0 о о 0 
O ше З=ъ (фо Ds 0 


Esto completa la construcción de la descomposición en valores singulares de A. 


Ejemplo 2 Determine la descomposición en valores singulares de la matriz 5 X 3 


> 
| 
=. ооо – 


01 
1.0 
1 1 
1 0 
1 0 


Solución En el ejemplo 1 encontramos que A tiene valores singulares sı = М5 ‚5 = „2, 
y 53 = 1, por lo que 


„5 0 0 
0 2 0 
S=| 0 0 1 
о 0 0 
о о 0 


Los eigenvectores de A'A correspondientes а sı = ү 5, s2 = 3/2, у s3 = 1 son, respecti- 
vamente, (1, 2, 1)", (1, —1,1),y (—1,0, 1) (consulte el ejercicio 5). Al normalizar estos 
vectores y usar los valores para las columnas V obtenemos 


У6 М _Y Yo {LK М6 

6 3 2 6 3 6 

= | 26 3 ' Зз м3 М 
а а 0 у к= Е зз a 
E М м АЕ у ат 

6 3 2 2 2 


Las primeras tres columnas de U son, por lo tanto, 


аг А (28 6 №) = ( 30 30 30 30 Ух) 
I= VS 6” 3? 6 15 2-15 2 10 + 15. > 10 id 
_ 1 УЗ Ya, УЗ Ye _\6 JE Y 

u = ~, Є , 2) = (5 $ 6 ‚0, 6 ‚0) , у 


A 
ГА 
ш = 1А ( ‚о, 2) = (0,0, 2,0, 2). 
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Ejemplo 3 


Para determinar las dos columnas restantes de U primero necesitamos dos vectores x4 y 
х5 por lo que {u;, ио, из, хд, X5} es un conjunto linealmente independiente. Entonces, apli- 
camos el proceso Gram-Schmidt para obtener ш y us de tal forma que (u;, о», U3, шщ, Us) 
es un conjunto ortogonal. Dos vectores que satisfacen el requisito de independencia lineal y 
ortogonalidad son 


u, = (1,1, —1, 1, —1) y us = (0, 1,0, —1, 0y. 


Al normalizar los vectores u;, para i = 1,2,3,4 y 5 produce la matriz U y la descomposición 
en valores singulares como 


/30 {6 0 У5 0 5 
15 3 5 5 0 0 
„30 Мб NE v2 
+. == 0 у у 0 20 
A=USV'=| y Z- 0 0o 0 1 

уй 6 o ж A||o 0 0 
15 6 5 2 0 0 0 
У30 о -2 х 0 
10 2 5 

[v6 м6 уб 

6 3 6 

УЗ “З Мз 

si з з 3 m 

Z o Y 

2 2 


Una dificultad con el proceso en el ejemplo 2 es la necesidad de determinar los vectores 
adicionales x4 y X5 para proporcionar un conjunto linealmente independiente sobre el que 
podemos aplicar el proceso de Gram-Schmidt. Ahora consideraremos una forma de simpli- 
ficarlo. 


Un método alternativo para encontrar U 
La parte v) del teorema 9.26 establece que los eigenvalores diferentes de cero de A'A y los 
de A4' son iguales. Además, los eigenvectores correspondientes de las matrices simétricas 
A'A y AA' forman subconjuntos ortonormales completos de R” y R”, respectivamente. Así el 
conjunto ortonormal de п eigenvectores para A'A forman las columnas de V, como se ha des- 
crito antes y el conjunto ortonormal de m eigenvectores para AA' forman las columnas de U 
de la misma forma. 
En resumen, entonces, para determinar la descomposición en valores singulares de la 

matriz А m X п, podemos: 
e Encontrar los eigenvalores 52 > s > > se > Sk}1 = +++ = Sn = 0 para la matriz 

simétrica A'A y colocar la raíz cuadrada positiva de S en la entrada (S); de la matriz 5 m X n. 


• Encontrar un conjunto de eigenvectores ortonormales (у, V2, ... , Vn} correspondiente a 
los eigenvalores de A'A y, entonces, construir la matriz V n X n con estos vectores como 
columnas. 


e Encontrar un conjunto de eigenvectores {u;, U2, ... , Um} correspondientes a los eigenva- 
lores de А А” y construir la matriz U m X т con estos vectores como columnas. 


Entonces А tiene la descomposición en valores singulares А = US V?. 


Determine la descomposición en valores singulares de la matriz 5 X 3 


> 

1 
=. ооо н 
У») 
оон о н 


al determinar U а partir de los eigenvectores de AA”. 
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Solución Tenemos 


1.0 1 20101 

0 1 0 1 0 0 0 1 0 1 1 1 1 
АА =| 0 1 1 0.111 1f=/|1 12 1 1], 

O 1 0 1 0 100 O 1 1 1 1 

1 1 0 1 1 1 1 2 


que tiene los mismos eigenvalores diferentes de сего como A' A, es decir, Ау = 5, А = 2, 
y Аз = ly, además, ^4 = Оу А5 = 0. Los eigenvectores correspondientes a estos eigen- 
valores son, respectivamente, 


=(0,232.3), x = (2, —1, 0, —1, 0), 
хз = (0,0, 1,0, —1), ж = (1,2, –1,0, –1)', 


у х5 = (0, 1,0, —1, 0%. 

Ambos conjuntos {X1, X2, X3, X4} y {X1, X2, Хз, X5} son ortogonales porque son eigenvec- 
tores relacionados con distintos eigenvalores de la matriz simétrica AA’. Sin embargo, х no 
es ortogonal a х5. Mantendremos хд como uno de los eigenvectores que se usan para formar U 
y determinar el quinto vector que proporcionará el conjunto ortogonal. Para esto, usamos 
el proceso Gram-Schmidt como se describe en el teorema 9.8 en la página 427. Usando la 
notación en ese teorema, tenemos 


Vi = X], V2 = X2, V3 = X3, V4 = X4, 


y, puesto que х; es ortogonal para todo menos хд, 


V4Xs 
Vs =X5— — 
V4V4 
t (1,2, —1,0,—1)- (0, 1,0, —1, 0) 
= (0, 1,0, —1,0) (1,2, —1,0, —1) 


101,2, —1,0, —1)]13 


2 1 
= (0, 1,0, —1, 0) 30,2, 1,0,-1) = „б. 3,—2,7,—2). 


Se verifica fácilmente que v5 es ortogonal а v4 = x4. También es ortogonal para los vectores 
en [v1, V2, Уз} porque es una combinación lineal de хд y x5. Al normalizar estos vectores 
obtenemos la matriz U en la factorización. Por lo tanto, 


S мо м уй 
15 3 7 35 
JO 6 о i зт 
15 6 7 70 
U = [u;, ш, uz, U4, us] = узо 0 A vI s 
S s Ma 
To -s 0 0 To 
m o м мт Mm 
10 2 7 35 


Esta es una U diferente a la que se encontró en el ejemplo 2, pero da una factorización válida 
А = U S V' usando las mismas S y V que en ese ejemplo. E 


Aproximación por mínimos cuadrados 


La descomposición en valores singulares se aplica en muchas áreas, una de las cuales es un 
medio alterno para encontrar los polinomios de mínimos cuadrados para ajustar datos. Sea A 
una matriz m X n, con m > n, y b un vector en R”. El objetivo de mínimos cuadrados es 
encontrar un vector x еп R” que minimizará || Ax — bļ||2. 
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Ejemplo 4 

Tabla 9.5 

i Xi Yi 

1 0 1.0000 

2 0.25 1.2840 

3 0.50 1.6487 

4 0.75 2.1170 

5 1.00 2.7183 


= Aproximación de eigenvalores 


Suponga que se conoce la descomposición en valores singulares de A, es decir, 


A=USV', 


donde U es una matriz ortogonal m X m, V es una matriz ortogonal п X пу S es una matriz 
т X п que contiene los valores singulares diferentes de cero en orden decreciente a lo lar- 
go de la diagonal principal en las primeras k < n filas y entradas cero en otra parte. Puesto 
que tanto U como V son ortogonales, tenemos UT! = U*,V7! = V’, y mediante la parte 
ш) del teorema 9.10 en la sección 9.2 en la página 428, U y V preservan la norma /›. Por 
consiguiente, 


ПАх — Ы = 10 S Vx — U U*bllo = |15 Ух — СЫ. 


Sea z = V'x y с = U'b. Entonces 


ПАх — Ы = [1 (5121 — сі, 5222 — C2, «+. , SkZk — Ск, Сал > ++» Cm) 1 
k m 1/2 
2 2 
= (Los =Q) + 5 (с) | ; 
izl i=k+1 


La norma se minimiza cuando se selecciona el vector z con 


Ci А 
=, cuando і < k, 
Zi = Si 
arbitrario, cuando k < i <n. 


Puesto que tanto с = U“b como x = Vz son fáciles de calcular, la solución de mínimos 
cuadrados también es fácil de encontrar. 


Use la técnica de descomposición en valores singulares para determinar el polinomio de 
mínimos cuadrados de grado 2 para los datos provistos en la tabla 9.5. 


Solución Este problema se resolvió usando ecuaciones normales, como en el ejemplo 2 en 
la sección 8.1. Primero necesitamos determinar la forma adecuada para A, x y b. En el ejem- 
plo 2 en la sección 8.1, el problema se describió como encontrar ao, ау y az con 


Р(х) = а +a1x + азх?. 


A fin de expresar esto en forma de matriz, hacemos 


Уо 1.0000 
ао yı 1.2840 
x=| a |, b=| у |= | 1.6487 |, y 
da Уз 2.1170 
Ул 2.7183 
1 xo хс 1 0 0 
1 x x? 1 0.25 0.0625 
А=|1 a %|=|1 05 025 
1 2з х. 1 0.75 0.5625 
1 x4 А. 11 1 
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La descomposición en valores singulares de A tiene la forma A = U S V”, donde 


026 —0.6327 0.6314 —0.0143 коо | 
—0.3466 —0.4550 —0.2104 0.2555 0.7505 
U = | -0.4159 —0.1942 —0.5244 —0.6809 —0.2250 |, 
—0.5025 0.1497 —0.3107 0.6524 —0.4505 
—0.6063 0.5767 0.4308 —0.2127 0.2628 
2.1117 0 0 
0 0.9371 0 —0.7987 —0.4712 —0.3742 
s=.|0 0 0.1627 |, y У = | —0.5929 0.5102 0.6231 
0 0 0 0.1027 —0.7195 0.6869 
0 0 0 
Por lo que, 
Уо —0.2945 —0.6327 0.6314 —0.0143 —0.3378]' [1 
yı —0.3466 —0.4550 —0.2104 0.2555 0.7505 1.284 
c=U' | y | = | —0.4159 —0.1942 —0.5244 —0.6809 —0.2250 1.6487 
y —0.5025 0.1497 —0.3107 0.6524 —0.4505 2.117 
y4 —0.6063 0.5767 0.4308 —0.2127 0.2628 2.7183 
—4.1372 
0.3473 
= 0.0099 |, 
—0.0059 
0.0155 
y los componentes de z son 
e, 41372 1.526 Cc _ 0.3473 — 0.3706 
ART A {= курулу к=» У 
0.0099 
z3 = Ž = E = 0.0609. 
=з 0.1627 
Esto da los coeficientes de mínimos cuadrados para Р›(х) como 
ао —0.7987 —0.5929 0.1027 — 1.526 1.005 
a | =x=Vz= 0.4712 0.5102 —0.7195 0.3706 | = | 0.8642 |, 
az —0.3742 0.6231 0.6869 0.0609 0.8437 


lo cual concuerda con los resultados en el ejemplo 2 de la sección 8.1. El error de mínimos 
cuadrados usando estos valores utiliza por lo menos dos componentes de с y es 


| Ax — ъ= 4/2 + с2 = \/(—0.0059)2 + (0.0155)? = 0.0165. 


Otras aplicaciones 


La razón de la importancia de la descomposición en valores singulares en muchas aplica- 
ciones es que nos permite obtener las características más importantes de una matriz m X n 
usando una matriz que, a menudo, es de tamaño significativamente más pequeño. Puesto 
que los valores singulares están en la diagonal de $ en orden decreciente, retener solamente 
las filas y columnas k de S produce la mejor aproximación posible para la matriz A. Como 
ilustración, consulte la figura 9.3, que indica la descomposición en valores singulares de la 
matriz A n X n. 
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Figura 9.3 


Figura 9.4 


Ilustración 


A=USV'= 


U S y! 
Ш A columnas n 


columnas n columnas m columnas n 


Reemplace la matriz S n X п con la matriz 5; k X К que contiene los valores singulares 
más significativos. Con toda certeza, éstos serán solamente los diferentes de cero, pero tam- 
bién podríamos eliminar algunos valores singulares que son relativamente pequeños. 

Determine las matrices Ug y Vý, correspondientes k X пут X k respectivamente, de 
acuerdo con el procedimiento de descomposición en valores singulares. Esto se muestra 
sombreado en la figura 9.4. 


U, Ху k ү! 
B Е columnas и 


columnas и columnas k columnas k 


Entonces la nueva matriz Ак = Up Sx У; sigue siendo de tamaño m X n y requeriría 
т - n registros de almacenamiento para su representación. Sin embargo, en forma facto- 
rizada, el requisito de almacenamiento рага los datos es m - k para Л, k para Si, y n  k para 
Ví para un total de k(m + n + 1). 

Suponga, por ejemplo, que m = 2n y k = n/3. Entonces la matriz original A contiene 
mn = 2n? puntos de datos. La factorización que produce Az, sin embargo, contiene sola- 
mente mk = 2n?/3 рага Uz, k para Sp y nk = n?/3 рага Уу puntos de datos, que ocupan 
un total de (n/ 3168n?+1) registros de almacenamiento. Ésta es una reducción de aproxima- 
damente 50% a partir de la cantidad requerida para almacenar toda la matriz A y los resulta- 
dos en lo que se conoce como compresión de datos. 


En el ejemplo 2, demostramos que 


8 


о ol е ol us 


у o Nh o o 


3 


sia 58 5 ala = 
ETE 
o © SJA © 
ooo © © 
oo.oo 
Мы БЫ ol 
э ыч 
SA lá ol 
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Considere las matrices reducidas relacionadas con esta factorización 


v30 y6 0 
15 3 
Уз _Y46- (у 
pS 6 % м5 0 0 
Љ= |30 0 % |, S=| 0 2 0|, у 
м0 56 o 0 0 1 
15 6 
Уз o -42 
10 2 
Ma v6 1 
6 3 6 
КА /2 
=з. 0 F 
Entonces 
м0 Мб м0 1 0 1 
6 3 6 0 1 0 
SV =| E -4 xv y Аз = 1035371 = |0 1 1 и 
A o л 0.1.0 
2 2 1 1 0 


Puesto que los cálculos en la ilustración se realizaron usando aritmética exacta, la matriz A3 
concuerda precisamente con la matriz original A. En general, se usaría la aritmética de dígi- 
tos finitos para hacer los cálculos y no se esperaría una concordancia absoluta. La esperanza 
es que la compresión de datos no resulte en una matriz Az que difiera significativamente de la 
matriz original A y esto depende de las magnitudes relativas de los valores singulares de A. 
Cuando el rango de la matriz A es k, no habrá deterioro ya que sólo existen k filas de la matriz 
original A que son linealmente independientes y, en teoría, la matriz podría reducirse en una 
que tiene todos los ceros en sus últimas filas m — k o columnas n — k. Cuando k es menor al 
rango de A, Az diferirá de A, pero no siempre será en su detrimento. 

Considere la situación que se presenta cuando А es una matriz que consiste en pixeles en 
una fotografía en escala de grises, que tal vez se tomó a gran distancia, como una fotografía de 
satélite de una parte de la Tierra. Es probable que la fotografía incluya ruido, es decir, datos que 
no representan verdaderamente la imagen, sino el deterioro de ésta mediante partículas atmosfé- 
ricas, la calidad de las lentes y procesos de reproducción, y así sucesivamente. Los datos de rui- 
do se incorporan en los datos determinados en A, pero con suerte este ruido es mucho menos 
significativo que la verdadera imagen. Esperamos que los valores singulares más grandes 
representen la verdadera imagen y que los más pequeños, los más cercanos a cero, sean las 
contribuciones del ruido. Al realizar la descomposición en valores singulares que solamente 
retiene esos valores singulares por encima de cierto umbral, podríamos ser capaces de eli- 
minar la mayor parte del ruido y, en realidad, obtener una imagen que no sólo sea de menor 
tamaño sino también una representación verdadera de la fotografía original. (Consulte [AP] 
para más detalles, especialmente, la figura 3). 

Otras aplicaciones importantes de la descomposición en valores singulares incluyen de- 
terminar números de condición efectivos para las matrices cuadradas (consulte el ejercicio 19), 
determinar el rango efectivo de una matriz y eliminar el ruido de la señal. Para más informa- 
ción sobre este importante tema y una interpretación geométrica de la factorización, examine 
el artículo de Kalman [Ka] y las referencias en ese documento. Para un estudio más completo 
y extenso de la teoría, consulte Golub y van Loan [GV]. 


La sección Conjunto de ejercicios 9.6 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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WEN 9.7 Software numérico 


Las subrutinas en las bibliotecas IMSL y NAG, así como las subrutinas en Netlib y los co- 
mandos en MATLAB, Maple y Mathematica, están basadas en las incluidas en los paquetes 
EISPACK y LAPACK, que se analizan en la sección 1.4. En general, las subrutinas transfor- 
man una matriz en la forma adecuada para el método QR o una de sus modificaciones, como 
el método QL. Las subrutinas aproximan todos los eigenvalores y pueden aproximar un 
eigenvector relacionado para cada eigenvalor. En general, las matrices no simétricas se equi- 
libran de tal forma que las sumas de las magnitudes de las entradas en cada fila y columna 
son casi iguales. Entonces se aplica el método Householder para determinar una matriz Hes- 
senberg superior similar. Los eigenvalores se pueden calcular con el método QR o QL. Tam- 
bién es posible aplicar la forma de Schur S DS*, donde S es ortogonal y la diagonal de D 
mantiene los eigenvalores de A. Los eigenvectores correspondientes pueden entonces estar 
determinados. Para una matriz simétrica se calcula una matriz tridiagonal similar. Entonces, 
se pueden calcular los eigenvectores correspondientes usando el método QR o QL. 

Existen rutinas especiales para encontrar todos los eigenvalores con un intervalo o una 
región, o que sólo encuentran el eigenvalor más grande o más pequeño. También existen 
subrutinas para determinar la precisión de la aproximación del eigenvalor y la sensibilidad 
del proceso al error de redondeo. 

Un procedimiento MATLAB que calcula un número seleccionado de eigenvalores y 
eigenvectores está basado en el método Arnoldi implícitamente reiniciado de Sorensen [50]. 
Existe un paquete de software incluido en Netlib para resolver problemas de eigenvalores de 
gran dispersión que también está basado en el método Arnoldi implícitamente reiniciado. El 
método Arnoldi implícitamente reiniciado es un método de subespacio Krylov que encuen- 
tra una sucesión de subespacios Krylov que convergen en un subespacio que contiene los 
eigenvalores. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Soluciones numéricas de sistemas 
de ecuaciones no lineales 


Introducción 


La cantidad de presión requerida para hundir un objeto grande y pesado en un suelo homo- 
géneo y blando que se encuentra sobre tierra de base dura se puede predecir por medio de la 
cantidad de presión requerida para hundir objetos más pequeños en la misma tierra. Espe- 
cialmente, la cantidad de presión p para hundir una placa circular de radio r a una distancia d 
en tierra blanda, donde la tierra de base dura se encuentra a una distancia D > d por debajo 
de la superficie, se puede aproximar mediante una ecuación de la forma 


p= kief? + kyr, 


donde kı, k2 у Кз son constantes, dependiendo de d y de la consistencia del suelo pero no 
del radio de la placa. 

Existen tres constantes desconocidas en esta ecuación, por lo que tres placas pequeñas 
con diferentes radios se hunden a la misma distancia. Esto determinará el tamaño mínimo de 
la placa requerido para mantener una carga grande. Se registran las cargas necesarias para 
este hundimiento, como se muestra en la figura adjunta. 


Esto produce las tres ecuaciones no lineales 
— karı 
mı = kye! + Кзг\, 
— kara 3 
ma = Ке 22 +k3r2 y 
тз = ke 23 + kzr3. 
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= Soluciones numéricas de sistemas de ecuaciones no lineales 


en los tres valores desconocidos kı, Кә y Аз. Normalmente, los métodos de aproximación 
numérica son necesarios para resolver sistemas de ecuaciones cuando éstas no son lineales. 
El ejercicio 10 de la sección 10.2 se preocupa por una aplicación del tipo descrito aquí. 

La resolución de un sistema de ecuaciones no lineales es un problema que se evita 
siempre que sea posible, por regla general, al aproximar el sistema no lineal mediante un 
sistema de ecuaciones lineales. Cuando esto no es satisfactorio, el problema debe abordarse 
de manera directa. El enfoque más sencillo es adaptar los métodos del capítulo 2, los cuales 
aproximan las soluciones de una ecuación no lineal individual en una variable, que se apli- 
carán cuando el problema de una sola variable sea reemplazado por un problema vectorial 
que incluye todas las variables. 

La principal herramienta en el capítulo 2 era el método de Newton, una técnica que, 
en general, es cuadráticamente convergente. Ésta es la primera técnica que modificamos 
para resolver los sistemas de ecuaciones no lineales. La aplicación del método de Newton, 
de acuerdo con lo modificado para los sistemas de ecuaciones, es bastante costosa y en la 
sección 10.3 describimos cómo se puede usar el método de secante para obtener aproxima- 
ciones con mayor facilidad, aunque con una pérdida de la convergencia en extremo rápida 
que puede producir el método de Newton. 

La sección 10.4 describe el método de descenso más rápido. Sólo es linealmente conver- 
gente, pero no requiere las aproximaciones iniciales precisas necesarias para las técnicas más 
rápidas de convergencia. А menudo se usa para encontrar una buena aproximación inicial 
para el método de Newton o una de sus modificaciones. 

En la sección 10.5 proporcionamos una introducción para los métodos de continuación, 
que usan un parámetro para ir de un problema con una solución fácilmente determinada a la 
solución del problema no lineal original. 

En este capítulo se omiten muchas de las pruebas de los resultados teóricos porque 
implican métodos que, normalmente, se estudian en cálculo avanzado. Una buena referen- 
cia general para este material es el libro de Ortega titulado Numerical Analysis-A Second 
Course (Análisis numérico — Un segundo curso) [Or2]. Una referencia más completa 
es [OR]. 
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Un sistema de ecuaciones no lineales tiene la forma 


Л (и, Arecas Xa) =0, 
Pi ж, ау п) =0, 
(10.1) 


Ой» X2,---, Xp) =0, 


donde cada función f; se puede pensar como un mapeo de un vector х = (X1, X2, ... , Xn) 
del espacio n dimensional R” en la recta real R. En la figura 10.1 se muestra una representa- 
ción geométrica de un sistema no lineal cuando n = 2. 

Este sistema de n ecuaciones no lineales en n variables también se puede representar al 
definir una función F de mapeo R” en R”. 


F(x1,x2,... Эй) = (JI х2, ... ЖО), Ой» Жз. ++. sn), i 01,0, Elo Xd). 


Si se utiliza notación vectorial para representar las variables x1, x2, ... , Xx, entonces el sis- 
tema (10.1) asume la forma 


Е(х) =0. (10.2) 


Las funciones fi, f>,... , fa reciben el nombre de funciones coordenadas de Е. 
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Figura 10.1 


z = fx] x2) 


z = f(x, x2) 


Ejemplo 1 Escriba el sistema no lineal 3 X 3 


1 
3x1 — cos(x2x3) — 2 = (), 


x? — 81 (x2 + 0.1)? + sen x3 + 1.06 = 0, 
107 -3 


e “2 + 20x3 + 5 я 


en la forma (10.2) 


Solución Defina las tres funciones coordenadas fi, > у fs desde R? hasta R como 


1 
fi (x1, х2, х3) = 3x1 — COs(x2X3) — 5, 


2 
Б(х\, хә, хз) = x? — 81 (x2 +0.1) + senx3 + 1.06 y 


107 — 3 
Бб, xa, хз) = 2 4 2053 + 2. 


Entonces, defina F desde R? —> R? mediante 
E(x) = F(x1, x2, Хз) 


= (fi (01, х2, х3), f2(%1, X2, хз), f (x1, хә, X3))' 


1 
= Є = соз(холз) — 5, x? — 81(х + 0.1)? 
107 — 3N' 
+ sen хз + 1.06,e "1 + 20x3 + 3) | н 


Antes de analizar la solución de un sistema provisto en la forma (10.1) o (10.2), nece- 
sitamos algunos resultados respecto a la continuidad y diferenciabilidad de las funciones 
desde R” hasta R”. A pesar de que este estudio podría representarse directamente (consulte 
el ejercicio 14), usamos un método alternativo que nos permite representar teóricamente los 
conceptos más difíciles de límites y continuidad en términos de funciones desde R” hasta R. 
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Definición 10.1 


Definición 10.2 


Las definiciones de continuidad 
para las funciones de n variables 
siguen de aquellas para una sola 
variable al reemplazar, siempre 
que sea necesario, los valores 
absolutos por normas. 


Definición 10.3 


Sea f una función definida en un conjunto D C R” y rango en R. Se dice que la función f 
tiene límite L en хо, escrito 


lím fx) = Г, 


xX>X0 
si, dado cualquier número є > 0, existe un número ô > 0 con 
|/(х) — El <e, 
siempre quex € D, y 
0 < |Ix — Xoll < ô. п 


La existencia de un límite también es independiente de la norma vectorial particular que 
se usa, como se analizó en la sección 7.1. Cualquier norma conveniente se puede usar para 
satisfacer la condición en esta definición. El valor específico de ô dependerá de la norma 
seleccionada, pero la existencia de ô es independiente de la norma. 

La noción de límite nos permite definir la continuidad para las funciones desde R” 
hasta К. Aunque es posible usar varias normas, la continuidad es independiente de la se- 
lección particular. 


Sea f una función del conjunto D C R” en R. La función f es continua en хо € D siempre 
que exista lím xx /(х) y 


Jím fœ = f). 


Además, f es continua en un conjunto D si f es continua en cada punto de D. Este concepto 
se expresa al escribir f € C (D). п 


Ahora podemos definir los conceptos de límite y continuidad para las funciones desde 
R” hasta R” al considerar las funciones coordenadas desde R” en R. 


Sea F una función desde D с R” a R” de la forma 


Е(х) = (100, 5%(®),..., £0), 


donde f; es un mapeo de R” hasta R para cada i. Definimos 


lím Е(х) =L = (Lı, Din , La), 


X—>X0 
si y sólo si йу ҳу Ji (X) = L; para cada = 1,2,...,n. ш 


La función F es continua en xy € D siempre que exista límx,x, Е(х) y lMx>xp 
F(x) = Е(хо). Además, F es continua en el conjunto D si F es continua en cada x en D. 
Este concepto se expresa al escribir F € C(D). 

Para las funciones desde R hasta R, la continuidad a menudo se puede evidenciar al 
demostrar que la función es diferenciable (consulte el teorema 1.6). Aunque este teorema se 
generaliza en funciones de diversas variables, la derivada (o derivada total) de una función 
de diversas variables está muy involucrada y no se presentará aquí. Por el contrario, estable- 
cemos el siguiente teorema, que relaciona la continuidad de una función de n variables en un 
punto con las derivadas parciales de la función en el punto. 


Teorema 10.4 


Definición 10.5 


Teorema 10.6 


Ejemplo 2 
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Sea funa función de D C К” а К y xo є D. Suponga que existen todas las derivadas parcia- 
les de fy las constantes ô > Оу K > 0 ‚йе tal forma que siempre que |х — хо|| < 8 y x € D, 
tenemos 


д 
| fŒ) < K, paracada ¡=1,2,...,n. 


dx; 


Entonces fes continua en Xo. п 
Puntos fijos еп R” 


En el capítulo 2 se desarrolló un proceso iterativo para resolver una ecuación f(x) = 0, al 
transformar primero la ecuación en la forma de punto fijo x = g(x). Se investigará un proceso 
similar para las funciones desde R” hasta R”. 


Una función G desde D C R” hasta R” tiene un punto fijo en p € D si G(p) = p. ш 


El siguiente teorema generaliza el teorema de punto fijo 2.4 en la página 47 para el caso 
n-dimensional. Este teorema es un caso especial del teorema de función contractiva y su 
demostración se puede encontrar en [Or2], p. 153. 


Sea D = { (x1, X2, ... , Xn) | a; < xi < bi, para cada i =1,2,... ‚п } para algún conjunto 
de constantes ај, a2, ... , an у bi, b2,... , bn. Suponga que G es una función continua en 
D c R” a R” con la propiedad de que G(x) є D, siempre que x € D. Entonces G tiene un 
punto fijo en D. 

Además, suponga que todas las funciones componentes de G tienen derivadas parciales 
continuas y que existe una constante K < 1 con 


dg (X K 
8:09) < —, siempre дие хє р, 
дх; 
рага сайа j = 1, 2,... , пу cada función componente g;. Entonces, Іа sucesión de punto fijo 


{х®}°° definida por x® seleccionada arbitrariamente en D y generada por medio de 
x® = С(х®-Р), рага cada К > 1 


converge al único punto fijo p € D y 


(k) a) (0) 
|е p< © KO – х0]. (103) 
ш 
Considere el sistema no lineal 
1 
Зх = COS(x2X3) — а= 0, 
x? — 81002 + 0.1)? + sen хз + 1.06 = 0, у 
Е 107 — 3 
е 2 + 20x; + —— = 0 


en forma de punto fijo x = G(x) al resolver la ¡-ésima ecuación рага х;. Muestre que existe 
una solución única en 


D = { (x1, X2, X3) | —1 < x; < 1, para cada i= 1,2, 3), 


e itere a partir de x® = (0.1,0.1, —0.1)' hasta una precisión dentro de 1075 en la norma l 
obtenida. 
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Solución Al resolver la ¡-ésima ecuación para x; obtenemos el problema de punto fijo 


1 1 
x= 3 20s(%2x3) +-=, 


6 
1р, 
== оү + sen хз + 1.06 — 0.1, (10.4) 
ЇЙ ын: 107 — 3 
хз = eta Я 
20 60 


Sea G : R? —> R? definido por G(x) = (g1 (х), 92(х), g3(x))', donde 


1 1 
81%], X2, X3) = з “os(%2x3) + 6? 


1 
82(х1, 22,23) = ух + sen хз + 1.06 — 0.1, 


1 107 — 3 
e Я 


—X1X2 


20 60 


83(X1, X2, X3) = 
Los teoremas 10.4 y 10.6 se usarán para mostrar que G tiene un punto fijo único en 


D = { (x1, x2, x3) | —1<x;<1, para cadai = 1,2, 3). 


Para x = (x1, хо, x3) en D, 


1 1 
lg1(x1, Хә, Хз)| < з1©о8(хәлз)| + 6 < 0.50, 


1 1 
221, X2, x3)| = Бү} + senz + 1.0601 < gr eLo 04 < 0.09, 
y 
ЯТ, 1 1 еа ате 0.61 
X1, X2, X3)| = 77€ < e < 0.61. 
РОННИ 0 60 20 60 


Por lo que tenemos, para cada і = 1, 2, 3, 
—1 < 8¡(X1, X2, Хз) < 1. 


Por lo tanto, G(x) € D siempre que x € D. 
Encontrar límites para las derivadas parciales en D nos da 


ə 

дво, |882 дез o 

axı дх2 0X3 
asi como 

ə 1 1 ə 1 1 
281 |< Lixa] > |senx2x3] < > sen 1 < 0.281, | | < |а|: |sen x2x3] < sen1 < 0.281, 
0X2 3 3 Хз 3 3 
082 |x] 

£ < < 0.238, 

dx1|  94/x? + sen x3 + 1.06 940.218 

9 1 

a _ [80926] < < 0.119, 

dx3| 184/2 + sen хз + 1.06 1850.218 

9 СО | ə 4 
двз or Le < 0.14, двз | Pla < Le < 0.14. 
Әх\| 20 20 əxz) 20 20 


Tabla 10.1 
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Todas las derivadas parciales de 0, 22 y g3 están acotadas en D, por lo que el teorema 
10.4 implica que estas funciones son continuas en D. Por consiguiente, G es continua en D. 
Además, para cadax e D, 


08: 
ES <0.281, paracadai=1,2,3 y ¡=1,2,3, 


Ху 


у la condición en la segunda parte del teorema 10.6 se mantiene соп К = 3(0.281) = 0.843. 

De la misma forma, también es posible mostrar que 09; /0х ; еѕ continua en D para cada 
i = 1,2,3 у j = 1,2,3. (Esto se considera en el ejercicio 13.) Por consiguiente, G tiene 
un único punto fijo en D y el sistema no lineal tiene una solución en D. 

Observe que G tiene un punto fijo único en D, y esto no implica que la solución para el 
sistema original sea la única en este dominio porque la solución para хә en la ecuación (10.4) 
implicaba la selección de la raíz cuadrada principal. El ejercicio 5d) examina lo que ocurre 
si, por el contrario, se selecciona la raíz cuadrada negativa en este paso. 

Para aproximar el punto fijo p, seleccionamos x® = (0.1,0.1,—0.1)'. La sucesión de 
vectores generados por 


1 = Ж 1 
хб = 590502. Dyt 2 © 


1 2 
xP = LJe) + зеп х7) +1.06 — 0.1, y 


k 1 an, 107 —3 
х0 = е a... —— 
z 20 60 


converge con la solución única del sistema en la ecuación (10.4) Los resultados en la tabla 
10.1 se generaron hasta que 


|x® — х®— |] < 1077. Е 
© P т че ro o], 
0 0.10000000 0.10000000 —0.10000000 
1 0.49998333 0.00944115 —0.52310127 0.423 
2 0.49999593 0.00002557 —0.52336331 9.4 x 107—3 
3 0.50000000 0.00001234 —0.52359814 2.3 х 10% 
4 0.50000000 0.00000003 —0.52359847 1.2 х 1055 
5 0.50000000 0.00000002 —0.52359877 3.1 х 107 


Podríamos usar la cota de error (10.3) соп К = 0.843 en el ejemplo previo. Esto da 


(0.843) 


(5) _ 2 : 
Ix = Plo < 7084 


(0.423) < 1.15, 
lo que no indica la verdadera precisión de хб). La solución real es 


t 
p= (0.5, 0, =) ~ (0.5, 0, —0.5235987757)', porlo que |х — pll% < 2 x 107. 
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Tabla 10.2 
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Aceleración de la convergencia 


Una forma de acelerar la convergencia de la iteración de punto fijo es usar los últimos cálcu- 

k k k=1 k-1 k у 
los xí l gss а en lugar de xí i a y para calcular х; ? como еп el método de 
Gauss-Siedel para los sistemas lineales. Entonces, las ecuaciones del componente para el 


problema en el ejemplo se convierten en 


o l —1) (к 1 
х® = 3 cos (f Dysk D) F 6 


1 2 
9 = г (59) + sen х0 +1.06 — 0.1, y 


1 0,0 107 —3 
—e 19% — —; 
20 60 


Соп х = (0.1,0.1,—0.1), los resultados de estos cálculos se muestran еп la tabla 10.2 


k Жү? д? qn |х® = х) |. 
0 0.10000000 0.10000000 —0.10000000 

1 0.49998333 0.02222979 —0.52304613 0.423 

2 0.49997747 0.00002815 —0.52359807 22 х 107? 

3 0.50000000 0.00000004 —0.52359877 2.8 x 107% 

4 0.50000000 0.00000000 —0.52359877 3.8 x 1078 


La iteración х es precisa dentro de 1077 en la norma Z»; por lo que la convergencia 
estaba, de hecho, acelerada para este problema al usar el método de Gauss-Siedel. Sin em- 
bargo, este método no siempre acelera la convergencia. 


La sección Conjunto de ejercicios 10.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 10.2 Método de Newton 


El problema en el ejemplo 2 de la sección 10.1 se transforma en un problema de punto fijo 
convergente al resolver algebraicamente las tres ecuaciones para las tres variables хі, х2 
y x3. Sin embargo, es poco común ser capaz de encontrar una representación explícita para 
todas las variables. En esta sección, consideramos un procedimiento algorítmico para reali- 
zar la transformación en una situación más general. 

Para construir el algoritmo que conduce a un método de punto fijo adecuado en el caso 
unidimensional, encontramos una función ф con la propiedad de que 


8(х) =x -paf a) 


da convergencia cuadrática para el punto fijo p de la función g (consulte la sección 2.4). A 
partir de esta condición el método de Newton evolucionó al seleccionar ф(х) = 1/7 '(х), 
suponiendo que f'(x) = 0. 

Un enfoque similar en el caso n-dimensional implica una matriz 


ay (x) а(х) An (Xx) 
а21(х) a(x) an (X) 

A(x) = : ; ; (10.5) 
апі (х) an (х) Ann (x) 


Teorema 10.7 
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donde cada una de las entradas а; (х) es una función de R” a R. Esto requiere encontrar A(x) 
de tal forma que 


С(х) = x – А(х) FG) 


da convergencia cuadrática para la solución de F(x) = 0, suponiendo que A(x) es no singular 
en el punto fijo p de G. 

El siguiente teorema se compara con el teorema 2.8 en la página 59. Su demostración 
requiere ser capaz de expresar G en términos de su serie de Taylor en n variables alrededor 
de p. 


Si р es la solución de G(x) = x. Suponga que existe un número ô > 0 con las propiedades: 


i) 0g;/0x;es continua en N; = {x | |x — pl| < 8), para cada i =1,2,...,n y 
к= IN DE 


ii) 221 (x)/(0x/0x,) es continua y 1922; (Хх) /(0x¡0x;)] < M para algunas constantes 
М, siempre que x € Ns, para сайа і = 1, 2,...,п, ј = 1,2,...,n,y К = 
ПЕРНЕ E 


iii) де;(р)/дх = 0, para cada i = 1, 2,...,пуќ = 1, 2,..., п. 


Entonces, un número 3 < ô existe de tal forma que la sucesión generada рог х® = G(x4-D) 
converge de forma cuadrática en р para cualquier selección de x®, siempre y cuando 
|x® — p|| < ô. Además, 


2 
nM g 
х — plo < = lx“ – pll» para cada k = 1. е 


Para aplicar el teorema 10.7, suponga que A(x) es una matriz п X п de funciones de R” 
a R en la forma de la ecuación (10.5), donde las entradas específicas se seleccionarán más 
adelante. Suponga, además, que A(x) es no singular cerca de una solución p de F(x) = 0 y 
sea que b;;(x) denote la entrada de A(x) | еп la ¡-ésima fila y la ¡-ésima columna. 


Рага G(x) = x — А(х) Е(х), tenemos g; (x) = x; — Уа b¡¡(x) f; (х). De modo que, 


n 


кы) СЕ = оло). sii =k, 


дв; [= OXk д 
aa ы af ðb 
k j ij Е 
-` (60) (к) + (к) 0х) ), ві Ak. 
Jz OXk OXk 
El teorema 10.7 implica que necesitamos де;(р)/дх = 0, para cada i = 1,2,...,n 


yk=1,2,...,n. Esto significa que para = k, 


n af, 
0=1- > Ь (р) — (р), 
2- jP) Эх; (р) 
es decir, 
n 9 А 
> bij) СА (р) = 1. (10.6) 
д Xi 
j=l 
Cuando k Æ i, 


n 9 Я 
0=- AO 
j=1 
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La matriz jacobiana apareció 
por primera vez en 1815, en un 
artículo de Cauchy, pero Jacobi 
escribió De determinantibus 
functionalibus, en 1841, y probó 
numerosos resultados sobre esta 
matriz. 
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de tal forma que 


n 9 E 
У?ь;0) “Дб =0. (10.7) 
=! ds 
La matriz jacobiana 
Defina la matriz J (x) mediante 
df afi afi 
Эх ® dm e se бу 
df afa df 
mosla sa” a (10.8) 
dfn д}, fn 
TA (x) Элә (x) ... a (x) 


Entonces, las condiciones (10.6) y (10.7) requieren que 
Ap)! J(p) = І, la matriz de identidad, por loque A(p) = J(p). 


Una selección adecuada para A(x) es, por consiguiente, A(x) = J (x) ya que ésta satisface la 
condición iii) en el teorema 10.7. La función G se define mediante 


С(х) =x- Ј(х) FG), 
y el procedimiento de iteración de punto fijo evoluciona al seleccionar x® y generar, para 
К> 1, 


х® — С(х®-2) = xD _ SES TES (10.9) 


Esto recibe el nombre de método de Newton para sistemas no lineales y en general se 
espera que proporcione convergencia cuadrática, siempre y cuando se conozca un valor ini- 
cial suficientemente preciso y que J (р)! exista. La matriz J (х) recibe el nombre de matriz 
jacobiana y tiene numerosas aplicaciones en análisis. En especial, podría resultar familiar 
para el lector debido a su aplicación en la integración múltiple de una función de diversas 
variables sobre una región que requiere que se efectúe un cambio de variables. 

Una debilidad en el método de Newton surge de la necesidad de calcular e invertir la 
matriz J (x) en cada paso. En la práctica, el cálculo explícito de J (x)! se evita al realizar 
la operación en una forma de dos pasos. Primero, se encuentra un vector y que satisface 
1(х®-Ю)уу = —Е(х®—?)). Entonces, la nueva aproximación, х, se obtiene sumando y a 
х®—). El algoritmo 10.1 utiliza este procedimiento de dos pasos. 


Método de Newton para sistemas 


Para aproximar la solución del sistema no lineal F(x) = 0 , dada una aproximación inicial x: 


ENTRADA número n de ecuaciones y valores desconocidos; aproximación inicial 
х = (X1,..., Xp)”, tolerancia TOL; número máximo de iteraciones N. 

SALIDA solución aproximada x = (x],..., х„)' о un mensaje que indica que se excedió 
el número de iteraciones. 
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Paso 1 Determine k = 1. 

Paso 2 Mientras (К < N) haga los pasos 3—7. 
Paso 3 Calcule F(x) y J (x), donde J (x); ; = (94: (х)/0х;) para 1< i, j < п. 
Paso 4 Resuelva el sistema lineal n x n J(x)y = —F (x). 
Paso 5 Determine x = x + y. 


Paso 6 Si ||у|| < TOL entonces SALIDA (х); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 7 Determine k =k + 1. 


Paso 8 SALIDA (‘Número máximo de iteraciones excedido’); 
(El procedimiento no fue exitoso.) 
PARE. a 


Ejemplo 1 El sistema no lineal 


1 
3x1 — cos(x2x3) — 5 = 0; 


х2 — 81 (x2 + 0.1)” + sen x3 + 1.06 = 0, y 
10л-—3 _ 
= 


е *1*? + 20x3 + 0 


se mostró en el ejemplo 2 de la sección 10.1 para tener la solución aproximada (0.5, 0, 
—0.52359877)'. Aplique el método de Newton para este problema con х = (0.1, 0.1, 0.1). 


Solución Defina 


F(x1, x2, хз) = (4101, хо, х3), f2(%1, X2, Хз), (x1, X2, 13))', 


donde 

Л (х1, X2, x3) = 3x1 — cos(x2x3) — A 

faxi, x2, хз) = x? — 81 (x2 + 0.1)? + sen x3 + 1.06, 
y 


107 — 3 
Р(х, хә, хз) =e "92 + 20x3 + de . 


La matriz jacobiana J (x) para este sistema es 


3 X3 SEN X2X3 Хә SEN X2X3 
J(x1,X2,X3) = 2x1 —162(x2 + 0.1) COS Хз 
= е "n = 2 20 


Seax% = (0.1,0.1,—0.1)”. Entonces Е(х = (—0.199995, —2.269833417, 8.462025346) 
y 


| 3 9.999833334 x 107* 9.999833334 х 10 
JA) = 0.2 —32.4 0.9950041653 ; 
[ш ху —0.09900498337 20 | 
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Table 10.3 


La resolución del sistema lineal J (x®)y® = —F(x0)) da 
0.3998696728 0.4998696782 
у = | —0.08053315147 у х0 = х0 +y = 0.01946684853 
—0.4215204718 —0.5215204718 
Al continuar рага k = 2, 3,... , tenemos 
(2 (1) (k-1 
Xi 1 1 | 
7 х0 Е y ¿ED | 
k k-1 k-1 
xl ) xí ) \ ) 
donde 
(k1 
yı | E 
y ED 2 (J C F a a | 
(k—1) 
Уз 
Por lo tanto, en el k-ésimo paso, el sistema lineal J (х) уќ) = —Е(х®—1!)) se debe 


resolver, donde 


3 (k—D) GD (ED) х0 ¿DD 


x3 sen x3 sen x 
J (%0) = 2х0) —162 = 4 0.1) cos х) 
_ (к—1) (k-1) La (k—1) (k—1) 
-xÝ Dexi 79 -xt Пат 20 
(k—1) 
yı 
(k=1) — (k=1) 
y => ул > 
(k=1) 
Уз 
y 


go — cos xf Рх = 1 


2 2, 
F (09) = | (KP)? —в1(х =” 40.1) хеп? y 1.06 


201) 1) = 

emi М» E х Dy r3 
Los resultados por medio del procedimiento iterativo se muestran en la tabla 10.3. п 
К хі Y ху) [x® = x6 la 
0 0.1000000000 0.1000000000 —0.1000000000 
1 0.4998696728 0.0194668485 —0.5215204718 0.4215204718 
2 0.5000142403 0.0015885914 —0.5235569638 1.788 х 1072 
3 0.5000000113 0.0000124448 —0.5235984500 1.576 x 107° 
4 0.5000000000 8.516 x 1071 —0.5235987755 1.244 х 1075 
5 0.5000000000 —1.375 х 10" —0.5235987756 8.654 x 1071 


El ejemplo previo ilustra que el método de Newton puede converger muy rápidamente 
una vez que se obtiene una buena aproximación que está cerca de la solución verdadera. 
Sin embargo, no siempre es fácil determinar buenos valores iniciales, y el uso del método 
es comparativamente caro. En la siguiente sección consideramos un método para superar 
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la última debilidad. Normalmente se encuentran buenos valores iniciales con el método de 
descenso más rápido, que se analizará en la sección 10.4. 


La sección Conjunto de ejercicios 10.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


10.3 Métodos cuasi-Newton 


Una debilidad significativa del método de Newton para resolver sistemas de ecuaciones 
no lineales es la necesidad, en cada iteración, de determinar una matriz y resolver un sistema 
lineal n X n que implica esta matriz. Considere la cantidad de cálculos relacionados con 
una iteración del método de Newton. La matriz jacobiana relacionada con un sistema de n 
ecuaciones lineales escrito en la forma F(x) = 0 requiere que las derivadas parciales n? de 
las n funciones de componentes de F sean determinadas y evaluadas. En muchas situaciones, 
la evaluación exacta de las derivadas parciales es inconveniente aunque el problema se ha 
vuelto más tratable con el uso generalizado de los sistemas computacionales simbólicos, 
como Maple, Mathematica y Matlab. 

Cuando la evaluación exacta no es práctica, podemos usar aproximaciones de diferencia 
finita para las derivadas parciales. Por ejemplo, 


Fx + ел) — /у(Х®) 


10.1 
a (10.10) 


2 0) я 
дх k 

donde h es pequeño en valor absoluto y ex es el vector cuya única entrada diferente a cero 
es un 1 en la k-ésima coordenada. Sin embargo, esta aproximación sigue requiriendo la 
realización de por lo menos n? evaluaciones funcionales escalares para aproximar la matriz 
jacobiana y no disminuye la cantidad de cálculos, en general O(n*), requerida para resolver 
el sistema lineal relacionado con esta matriz jacobiana aproximada. 

El esfuerzo computacional total para una sola iteración del método de Newton es, por 
consiguiente, por lo menos n? + n evaluaciones funcionales escalares (n? para la evaluación de 
la matriz jacobiana y n para la evaluación de F) junto con O(n’) operaciones aritméticas para 
resolver el sistema lineal. Esta cantidad de esfuerzo computacional es amplia, excepto para los 
valores relativamente pequeños de n y funciones escalares fácilmente evaluadas. 

En esta sección consideramos una generalización del método de secante para los siste- 
mas de ecuaciones no lineales, una técnica conocida como método de Broyden (consulte 
[Broy]). El método sólo requiere n evaluaciones funcionales escalares por iteración y tam- 
bién reduce el número de cálculos aritméticos para 01m). Pertenece a una clase de métodos 
conocidos como actualizaciones secantes del cambio mínimo que produce algoritmos llama- 
dos cuasi-Newton. Estos métodos reemplazan la matriz jacobiana en el método de Newton 
con una matriz de aproximación que se actualiza fácilmente en cada iteración. 

La desventaja de los métodos cuasi-Newton es que la convergencia cuadrática del méto- 
do de Newton se pierde, al ser reemplazada, en general, mediante una convergencia llamada 
superlineal. Esto implica que 


donde р denota la solución para F(x) = ду х у х!) son aproximaciones consecutivas 
para p. 

En muchas aplicaciones, la reducción de la convergencia superlineal es un intercambio 
más que aceptable para el decremento de la cantidad de cálculos. Una desventaja adicional 
de los métodos cuasi-Newton es que, a diferencia del método de Newton, no se autocorrigen. 
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En general, el método de Newton, corregirá el error de redondeo con iteraciones sucesivas, 
pero a menos que se incluyan resguardos especiales, el método de Broyden no lo hará. 

Para describir el método de Broyden, suponga que se determina una aproximación ini- 
cial x® para la solución р de F(x) = 0. Calculamos la siguiente aproximación x de la 
misma forma que el método de Newton. Si es inconveniente determinar J (x®%) exactamente, 
usamos las ecuaciones de diferencia dadas por la ecuación (10.10) para aproximar las deri- 
vadas parciales. Para calcular x®, sin embargo, partimos del método de Newton y examina- 
mos el método de secante para una ecuación no lineal singular. El método de secante usa la 
aproximación 


Дол) = F (xo) 


X1 Хо 


РО) % 


como reemplazo рага f'(x1) en el método de Newton de una sola variable. 

Para los sistemas no lineales, х(!) —x® es un vector, por lo que el cociente correspon- 
diente es indefinido. Sin embargo, el método procede de modo parecido en que reemplaza- 
mos la matriz J (x?) en el método de Newton para sistemas por medio de una matriz A; con 
la propiedad de que 


А (х0 —x0) =F (х0) — F (0). (10.11) 


Cualquier vector diferente de cero en R” se puede escribir como la suma de un múltiplo 
de x® —x® y un múltiplo de un vector en el complemento ortogonal de x —x® (consul- 
te el ejercicio 10). Por lo que, para definir únicamente la matriz А}, también necesitamos 
especificar cómo actúa en el complemento ortogonal de x® —х). No existe información 
disponible sobre el cambio en F en una dirección ortogonal para х(!) —x®, por lo que espe- 
cificamos que no se puede realizar ningún cambio en esta dirección; es decir, 


Aiz = J(x%)z, siempre que En — xOy z=0. (10.12) 


Por lo tanto, cualquier vector ortogonal para x'? —x® no resulta afectado por la actualiza- 
ción de J (x®), que se usó para calcular x” para Ay, lo cual se usa en la determinación de x®. 
Las condiciones (10.11) y (10.12) definen únicamente А} (consulte [DM]) como 


[F (х0) — F (0) – у (x0) (x0 – x0)] (x0 — к" 


— (0) 
СС pao xo) 


Es la matriz que se usa en lugar de J (х()) para determinar х2 сото 


x® =x” — АГЕ (х0), 


Una vez que se ha determinado x?, el método se repite para hallar x®, por medio de A; en 
lugar de Ay = J (х) y con x? y х' en lugar de x” y x®. 
En general, una vez que se ha determinado x® se calcula х7) por medio de 


i = Aj-18; 
Ai = А + === i (10.13) 
IIs: l2 
y 
ASA RE, (10.14) 
donde se introducen las notaciones y; = Е (x®) — F (xD) y s; = x% — x0" para 


simplificar las ecuaciones. 

Si los métodos se realizan de acuerdo con lo descrito en las ecuaciones (10.13) y (10.14), 
el número de evaluaciones funcionales escalares se reduciría desde n? + n hasta n (las re- 
queridas para evaluar F (х“ ))), pero se seguirían necesitando O(n°) cálculos para resolver el 
sistema lineal n X n (consulte el paso 4 en el algoritmo 10.1) 


Ав = —F (хб). (10.15) 


Teorema 10.8 
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Esta forma de usar el método podría no estar justificada debido a la reducción de la conver- 
gencia superlineal a partir de la convergencia cuadrática del método de Newton. 


Fórmula Sherman-Morrison 


Sin embargo, es posible incorporar una mejora considerable al usar una fórmula de inversión 
de matriz de Sherman y Morrison (consulte, por ejemplo, [DM], p. 55). La prueba de esta 
fórmula se considera en los ejercicios 11 y 12. 


(Fórmula Sherman-Morrison) 


Suponga que А es una matriz no singular y que х y y son los vectores con y A7lx Æ —1. 
Entonces А + xy' es no singular y 


(А+ ху) = 41 и 


La fórmula Sherman-Morrison permite calcular directamente Аг! а partir de АГІ, , lo 
cual elimina la necesidad de una inversión de matriz con cada iteración. 

Si hacemos А = Aj-1,X = (у; — А;_18:)/118:15, y у = s;, еп la ecuación (10.13) obte- 
nemos 


24 
-i уг = Aj-18; ; 
АГ! = СЕ + q) 
lls;115 
—1 | yi—Ai-18i ot -1 
Е az ( [гб s) Ага 
= A; 1 


Ка 115,113 
e (Ау — si) 8 Aj", 
||: ||; + 8А; у; — 1185113 


por lo que 


(si — Ay) s; Аг! 


Аг = Ау + 
i s; А; у; 


(10.16) 
Este cálculo sólo implica multiplicaciones matriz-vector еп cada paso y, por lo tanto, 
solamente requiere O (п?) cálculos aritméticos. Se evita el cálculo de A;, al igual que la nece- 
sidad de resolver el sistema lineal (10.15). 
El algoritmo 10.2 sigue directamente esta construcción, al incorporar la ecuación (10.16) 
en la técnica iterativa (10.14). 


Método de Broyden 


Para aproximar la solución del sistema no lineal F(x) = 0, dada una aproximación inicial x: 


ENTRADA número л de ecuaciones y variables; aproximación inicial х = (x1, .. . , Xp); 
tolerancia TOL; número máximo de iteraciones N. 


SALIDA solución aproximada х = (x1, .. ., Xn) о un mensaje que indica que el número 
de iteraciones fue excedido. 
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Paso 1 Determine Ay = J (х) donde J(x); ; = 220%) рага1 <}, j <n; 
У = F(x). (Nota: y= F&®).) 
Paso 2 Determine A = Ay 1 (Use la eliminación gaussiana.) 


Paso 3 Determine s = —Ау; (Nota:s = sı.) 
x=x+s; (Nota:x =x™) 
k=2, 


Paso 4 Mientras (k < N) haga los pasos 5-13. 


Paso 5 Determine w = v; (Conserve у.) 

ү = Е(х); (Nota: у = Е(х).) 

y =v-—w. (Vota: y = yx.) 
Paso 6 Determine z = — Ay. (Nota: 2 = Агур J 


Paso 7 Determine p = —s'z. (Nota: p = s Аг! ук.) 
Paso 8 Determine и’ =s'A. 

Paso 9 Determine A = A + ¿(s + ш. (Nota: A= Аг!) 
Paso 10 Determine s = —Av. (Nota: s =—A¿'E(x%).) 
Paso 11 Determine x = х +s. (Nota: x = х+)) ) 


Paso 12 Si ||s|| < TOL entonces SALIDA (х); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 13 Determine k =k + 1. 


Paso 14 SALIDA (‘Número máximo de iteraciones excedido’); 
(El procedimiento no fue exitoso.) 
PARE. ш 


Ejemplo 1 Use el método de Broyden соп х) = (0.1, 0.1, —0.1)' para aproximar la solución del sis- 
tema no lineal 


1 
Зх — COS(x2X3) — 7] = 0, 


x? — 81005 + 0.1)? + sen x3 + 1.06 = 0, 


107 — 3 


ein + 20x3 + =0. 


Solución Este sistema se resolvió mediante el método de Newton en el ejemplo 1 de la 
sección 10.2. La matriz jacobiana para este sistema es 


3 хз SEN X2X3 X2 SEN X2X3 
Í(X1, X2, х3) = 2х\ —162(x2 + 0.1) COS X3 
—x e *1*? =x e *!*? 20 


Si x® = (0.1,0.1, 0.1) y 


F(x1, х2, хз) = (Л (х1, хә, х3), f2(%1, хо, Хз), f (x1, X2, xX3)), 
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donde 
1 
А (х1, х2, х3) = 3x1 — COs(x2X3) = z 
Бл, хә, хз) = x? — 81 (x2 + 0.1)? + sen хз + 1.06, 
y 
ЕЕ 107 — 3 
ЛОл, 2,53) = е "1% + 20x3 + са 
Entonces 
—1.199950 
F (x0) = | -2.269833 
8.462025 
Puesto que 
Ао = 2 ( ‚^2 0) 0) 
9.999833 х 1074 —9.999833 x 1074 
—32.4 0.9950042 А 
—9. Ж х 1072 —9.900498 х 1072 20 
tenemos 
=J ( yO х0), Py 
0.3333332 1.023852 x 1075 1.615701 x 1075 
2.108607 x 1072 —3.086883 x 1072 1.535836 x 107? |. 


1.660520 x 1077 —1.527577 x 1074 5.000768 x 107? 


Por lo tanto 


0.4998697 
x® =x — Ay F (х) = |1.946685 x 10? |, 
—0.5215205 
—3.394465 х 1074 
Е (х7) = | —0.3443879 |, 
3.188238 х 1072 
1.199611 
yı = Е (х) - Е (х0) = | 1.925445 |, 
—8.430143 
0.3998697 
sı = | -8.053315 х 1072 |, 
—0.4215204 


si Ар "yı = 0.3424604, 


Ат! = Ас! + (1/0.3424604) | (sı — Асу) si Аб | 
0.3333781 1.11050 x 1075 8.967344 х 107% 
—2.021270 х 10-2 3.094849 х 1072 2.196906 х 107°], 


1.022214 х 1077 1.650709 х 1074 5.010986 х 107? 
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Tabla 10.4 


0.4999863 
x® =x0 — АПІЕ (х0) = |8.737833 x 10-3 
—0.5231746 


Las iteraciones adicionales se listan en la tabla 10.4. La quinta iteración del método de 
Broyden es ligeramente menos precisa que la cuarta iteración del método de Newton, dada 


en el ejemplo al final de la sección anterior. п 
k хі" х2) хі жб — x“? 

3 0.5000066 8.672157 x 107* —0.5236918 7.88 х 107° 

4 0.5000003 6.083352 х 107? —0.5235954 8.12 х 1074 

5 0.5000000 —1.448889 x 1076 —0.5235989 6.24 x 1075 

6 0.5000000 6.059030 x 107? —0.5235988 1.50 x 107% 


Los procedimientos también están disponibles de tal forma que se mantiene la conver- 
gencia, pero reducen significativamente el número de evaluaciones funcionales requeridas. 
Los métodos de este tipo fueron propuestos originalmente por Brown [Brow, K]. Una re- 
seña y comparación de algunos métodos de este tipo que se usan de manera común puede 
encontrarse en [MC]. No obstante, en general, estos métodos son mucho más difíciles de 
implementar de manera eficiente que el método de Broyden. 


La sección Conjunto de ejercicios 10.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


10.4 Técnicas de descenso más rápido 


El nombre del método de 
descenso más rápido sigue 

de la aplicación tridimensional de 
señalamiento en la dirección 
descendente más rápida. 


La ventaja de los métodos de Newton y cuasi-Newton para resolver sistemas de ecuaciones 
no lineales es su velocidad de convergencia una vez que se conoce una aproximación su- 
ficientemente exacta. Una debilidad de estos métodos es que se necesita una aproximación 
inicial precisa a la solución para garantizar la convergencia. El método de descenso más 
rápido que se considera en esta sección sólo converge linealmente para la solución, pero 
normalmente también convergerá para aproximaciones iniciales pobres. Por consiguiente, 
este método se usa para encontrar aproximaciones iniciales suficientemente exactas para las 
técnicas con base en Newton de la misma forma que se usa el método de bisección para una 
sola ecuación. 

El método de descenso más rápido determina un mínimo local para una función multiva- 
riable de la forma g : R” — R. El método es valioso más allá de la aplicación como método 
de inicio para resolver sistemas no lineales. (En los ejercicios se consideran algunas otras 
aplicaciones.) 

La conexión entre la minimización de una función de К” a R y la solución de un sistema 
de ecuaciones no lineales se debe al hecho de que un sistema de la forma 


ЛО, x2, еж ғ , Xp) =0, 


(х1, хә, ... , Xp) =0, 


Jais X2, ы ,Xn) =0, 


Definición 10.9 


El gradiente proviene de la raíz 
de la palabra latina gradi, que 
significa “caminar”. En este 
sentido, el gradiente de una 
superficie es la velocidad con la 
que “camina cuesta arriba” 
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tiene una solución en x = (x1, хә,... , хп)! precisamente cuando la función g definida por 


n 


8 (1, X2, ees , Xp) == У лба, хә, ре 1а 


i=1 


tiene el valor mínimo 0. 
El método del descenso más rápido para encontrar un mínimo local para una función 
arbitraria g de К” a R se puede describir de modo intuitivo de acuerdo con lo siguiente: 


t 
1. Evalúe g en una aproximación inicial x0) = (P Eo A 0) . 
2. Determine una dirección desde x® que resulte en un decremento del valor de g. 


3. Мбиеуа una cantidad adecuada en esta dirección y Пате al nuevo valor х?. 


(0) 1) 


4. Repita los pasos 1 a 3 con x® reemplazado por x'”. 


El gradiente de una función 


Antes de describir cómo seleccionar la dirección correcta y la distancia adecuada para mo- 
verse hacia esta dirección, necesitamos revisar algunos resultados a partir del cálculo. El 
teorema del valor extremo 1.9 establece que una función de una sola variable diferenciable 
puede tener un mínimo relativo sólo cuando su derivada es cero. Para ampliar este resultado 
para funciones multivariables, necesitamos la siguiente definición. 


Рага g : R” — R el gradiente de g en x= (х, X2, ... , Xn) se denota Vg(x) y se define 
como 


_ (0 д8 de Ny 
Ve(x) = (Ew, T Л O) : a 


El gradiente de una función multivariable es análogo a la derivada de una función de 
una sola variable en el sentido que una función multivariable diferenciable puede tener un 
mínimo relativo en x sólo cuando el gradiente en x es el vector cero. El gradiente tiene otra 
propiedad importante conectado con la minimización de funciones multivariable. Suponga 
que у = (01, 12,... , Uy) es un vector unitario en R”; es decir, 


п 
2 2 
Ivi =}, = 1. 


і=1 


La derivada direccional de g en х en la dirección de у mide el cambio en el valor de la 
función g relativo al cambio en la variable en la dirección de v. Se define mediante 


1 
Рув(х) = lím =g + лу) — 800] = У. Vg. 


Cuando g es diferenciable, la dirección que produce el valor máximo рага la derivada di- 
reccional se presenta cuando se selecciona v de forma paralela a Vg(x), siempre y cuando 
Ve(x) Æ 0. Por consiguiente, la dirección del mayor decremento en el valor de g en x es la 
dirección dada por —Vg(x). La figura 10.2 es una ilustración cuando g es una función de 
dos variables. 
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Figura 10.2 


z = 8(%],x2) 
ЕР 


(ху, X2, 8(X1,X2)) 


Dirección descendente más rápida 


н 


м -Vg 


El objetivo es reducir g (x) hasta su valor mínimo de cero, por lo que una selección ade- 
cuada para х“ es apartarse de х en la dirección que proporciona el mayor descenso en el 
valor de g(x). Por lo tanto, hacemos 


x” =x0 — av g (9) , рага alguna constante о > 0 (10.17) 


Ahora, el problema se reduce a seleccionar un valor adecuado de о por lo que g(x) sería 
significativamente menor а g(x0), 

Para determinar una selección adecuada para el valor œ, consideramos la función de una 
sola variable 


hlæ) = g (x® — a Vg (x®)). (10.18) 


El valor de о que minimiza л es el valor necesario para la ecuación (10.17). 

Encontrar un valor mínimo para h directamente requeriría diferenciar h y, después, 
resolver un problema de localización de raíz para determinar los puntos críticos de h. En 
general, este procedimiento es demasiado costoso. Por el contrario, elegimos tres números 
оу < 02 < оз que, esperamos, estén cerca de donde se presenta el valor mínimo de /(о). 
Entonces construimos el polinomio cuadrático Р(х) que interpola л en о], ох y оз. El míni- 
mo del polinomio cuadrático se encuentra fácilmente de forma similar a la que se usa en el 
método Müller en la sección 2.6. 

Definimos ё en [a ,, оз] de tal forma que P (4) es un mínimo en [«œ1, оз] y usamos P (4) 
para aproximar el valor mínimo de /(о). Entonces, se usa @ en la determinación de la itera- 
ción nueva para aproximar el valor mínimo de g: 


x0 = х® — 4Vg (хо). 


Puesto que g (x®) está disponible, para minimizar el cálculo, primero seleccionamos œ; = 0. 
A continuación se encuentra un número оз соп (оз) < h(a1). (Puesto que ој no minimiza 
h, este número оз existe). Finalmente, se selecciona о» que será оз /2. 

El valor mínimo de Р en [0, оз] se presenta ya sea en el único punto crítico de P o en el 
extremo derecho оз porque, por suposición, P(a3) = h(a3) < h(a1) = P (æ). Puesto que 
P(x) es un polinomio cuadrático, el punto crítico se puede encontrar al resolver la ecuación 
lineal. 


Ejemplo 1 
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Utilice el método de descenso más rápido соп x® = (0, 0, 0)' para encontrar una aproxima- 
ción inicial razonable para la solución del sistema no lineal 


1 
ДА (х\, хә, x3) = 3x1 — cos(x2x3)— = = 0, 


2 
БО, X2, X3) = A — 81 (x2 + 0.1)? + sen хз + 1.06 = 0, 
= 107 — 3 
f4(x1,x2,x3) = е "2 + 20x3 + = 0. 
Solución Si g(x1, x2, хз) = [fi (x1, x2, хз)р + [A (1, хә, x3)1? +[A(x1, 0, хз)р. 


Entonces 


Vg(Y1, хә, хз) = Vg) = (rož w + 2400700) + 20050, 


24 00709 T 2n б) +25 лоо, 


ОЛ — a m a A a ыг e о) 


= орау), 
Рага x® = (0, 0, 0)", tenemos 
g (к) = 111.975 у а = |18 (х) 1 = 419.554. 


Ѕеа 


1 
z = —Vg (x%) = (-0.0214514, —0.0193062, 0.999583). 
20 


Con a, = 0, tenemos gı = g (х) — œiz) = g (х) = 111.975. De manera arbitraria ha- 
cemos que оз = 1 de tal forma que 


83 = 8 (Хх) — az) = 93.5649. 
Puesto que өз < g1, aceptamos оз y establecemos о> = 03/2 = 0.5. Por lo tanto, 
82 = g (x0 — 072) = 2.53557. 


Ahora, encontramos el polinomio cuadrático que interpola los datos (0, 111.975), 
(1, 93.5649) y (0.5, 2.53557). Para este propósito, es más conveniente usar un polinomio de 
interpolación de diferencias divididas hacia adelante, que tiene la forma 


Р(а) = 81 +h10 + һз= (о — о»). 
Esto interpola 
2 0 —aVe (x®)) =g (ко _ от) 
a, = 0, оо = 0.5, y ©з = 1, como sigue: 


о =0, gı = 111.975, 


«з =0.5, в›=2.53557, hı = EL = —218.878, 
02 — Qı 
ho —h 
оз=1, gs =93.5649, == = 182.059, h3 = 2" = 400.937. 


Оз — 02 Оз — 01] 
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Por lo tanto, 
Р(а) = 111.975 — 218.878а + 400.937 (æ — 0.5). 


Tenemos Р'(а) = 0 cuando о = оо = 0.522959. Puesto que go = g (x% — az) = 
2.32762 es más pequeño que gı y g3, establecemos 


х) =x0 — goz = x® — 0.522959z = (0.0112182, 0.0100964, —0.522741)' 


g (x®) = 2.32762. 


La tabla 10.5 contiene el resto de los resultados. La verdadera solución para el sistema no 
lineal es (0.5, 0, —0.5235988)', por lo que х) probablemente sería adecuado como una 
aproximación inicial para el método de Newton o de Broyden. Una de las técnicas que con- 
vergen más rápidamente serían adecuadas en esta etapa уа que se requieren 70 iteraciones 


del método de descenso más rápido para encontrar |х“ — х||,, < 0.01. н 
Tabla 10.5 % х® хіб х® ¿AO xL, х®) 

2 0.137860 —0.205453 —0.522059 1.27406 

3 0.266959 0.00551102 —0.558494 1.06813 

4 0.272734 —0.008 11751 —0.522006 0.468309 

5 0.308689 —0.0204026 —0.533112 0.381087 

6 0.314308 —0.0147046 —0.520923 0.318837 

7 0.324267 —0.00852549 —0.528431 0.287024 


El algoritmo 10.3 implica el método de descenso más rápido рага aproximar el valor 
mínimo de g (х). Para comenzar una iteración, el valor 0 se asigna a о, y el valor 1 se asigna 
а оз. 51 А (0з) > h(œ1), entonces se realizan las divisiones sucesivas de оз entre 2 y el valor 
de «з se reasigna hasta que Л (оз) < h(œ1) y оз = 3 para algún valor de К. 

Para usar el método para aproximar la solución para el sistema 


А (1, х2, ..., хл) = 0, 


Р(х, хә, Роге ,Xn) =0, 


Л (х1, X2, к sa) =0, 


simplemente reemplazamos la función g con У)" e 


Descenso más rápido 


Para aproximar una solución p del problema de minimización 
8(р) = mín g(x) 
xeR” 
dada una aproximación inicial x: 


ENTRADA número n de variables; aproximación inicial x= (x1, ..., Xn); tolerancia 
TOL; número máximo de iteraciones N. 


SALIDA solución aproximada x = (x1,..., Х„)' o un mensaje de falla. 
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Paso 1 Determine k = 1. 
Paso 2 Mientras (k < N) haga los pasos 3-15. 


Paso 3 Determine gı = g(X1,..., Xn); (Nota: 281=28 (х®) ) 
®=Ув(х\,...,х„); (Моа:®= Vg (х®).) 
zo = |14112. 
Paso 4 Si zo = 0 entonces SALIDA (“gradiente cero”); 
SALIDA (X1,...,Xn, 81); 
(Procedimiento completo, puede tener un mínimo .) 


PARE. 
Paso 5 Determine 2 = 2/20; (Convierta z en vector unidad.) 
a, = 0; 
Q3 = 1; 
83 = 8(X— 032). 


Paso 6 Mientras (оз > gı) haga los pasos 7 y 8. 


Paso 7 Determine оз = 03/2; 
g3 = 8 (X — 037). 
Paso 8 Si оз < TOL/2 entonces 
SALIDA (‘Sin probable mejora); 
SALIDA (x1, ..., Xn, 81); 
(Procedimiento completado, puede tener un mínimo .) 
PARE. 


Paso 9 Determine œ = 03/2; 
g2 = £(X— 022). 
Paso 10 Determine hı = (e2 — g1)/@2; 
ha = (83 — 82)/(03 — 0); 
h3 = (Ло — h1)/03. 
(Nota: La fórmula de diferencias divididas hacia adelante de Newton 
se usa para encontrar P (œ) = g, + а + hsa («œ — œz) la 
cuadrática que interpola h (œ) епа = 0, а = о, а = аз.) 


Paso 11 Determine оо = 0.5(œ2 — hı /h3); (El punto crítico de P se presenta еп о.) 
go = 8 (X — 002). 

Paso 12 Encuentre о de (a, 0з} de modo que g = g(x — œz) = mín(go, 23). 

Paso 13 Determine x = х — gZ. 


Paso 14 Si|g — gı| < TOL entonces 
SALIDA (x1, ..., Xn, 8); 
(El procedimiento fue exitoso.) 
PARE. 


Paso 15 Determine k = k + 1. 


Paso 16 SALIDA (ʻiteraciones máximas excedidas”); 
(El procedimiento no fue exitoso.) 
PARE. н 
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Existen muchas variaciones del método de descenso más rápido, algunos de los cuales 
implican métodos más complejos para determinar el valor de о que producirá un mínimo 
para la función de variable única Л definida en la ecuación (10.18). Otras técnicas usan un 
polinomio de Taylor multidimensional para reemplazar la función multivariable g original y 
minimizar el polinomio en lugar de g. A pesar de que existen ventajas para algunos de estos 
métodos sobre el procedimiento analizado aquí, todos los métodos de descenso más rápido 
son, en general, linealmente convergentes y convergen independientemente de la aproxima- 
ción inicial. En algunos casos, sin embargo, los métodos pueden converger en algo más que 
el mínimo absoluto de la función g. 

Un análisis más completo de los métodos de descenso más rápido se puede encontrar en 
[OR] o [RR]. 


La sección Conjunto de ejercicios 10.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 10.5 Homotopía y métodos de continuación 


Los métodos de homotopía, o continuación, para los sistemas no lineales insertaron el pro- 
blema que debe resolverse dentro de un conjunto de problemas. En específico, para resolver 
un problema de la forma 


Е(х) =0, 


que posee la solución desconocida x*, consideramos una familia de problemas descritos 
usando un parámetro л que supone valores en [0, 1]. Un problema con una solución conoci- 
da x(0) corresponde a la situación cuando 4 = 0 y el problema con la solución desconocida 


х(1) = х* corresponde а^ = 1. 
Cp ешн Por ejemplo suponga que x(0) es una aproximación inicial para la solución de F(x*) = 0. 
deformación continua, una Рей 
función que toma un intervalo еппа 
real continuamente еп un 
conjunto de funciones. С: [0, 1] x R” > R” 
mediante 


С(А, х) = АЕ(х) + (1 — А) [E (x) — F(x(0))] = FG) + (А — 1)Е(х(0)). (10.19) 
Determinaremos, para varios valores de A, una solución para 
G(,x)=0. 
Cuando à = 0, esta ecuación asume la forma 
0 = G(0, х) = Fx) — Е(х(0)), 
y x(0) es una solución. Cuando А = 1, la ecuación asume la forma 
0 = G(1, x) = Е(х), 


y X(1) = x* es una solución. 

La función G, con el parámetro A, nos proporciona una familia de funciones que puede 
conducir al valor conocido x(0) para la solución x(1) = x*. La función G recibe el nombre 
de homotopía entre la función G(0, х) = F(x) —F(x(0)) y la función G(1, x) = F(x). 


Teorema 10.10 
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Método de continuación 


El problema de continuación es: 


• Determinar una forma de proceder con la solución conocida x(0) de С(0, х) = 0 para la 
solución desconocida x(1) = x* de G(1, x) = 0, es decir, la solución para F(x) = 0. 


Primero suponemos que х(^.) es una solución única para la ecuación 


С(.,х) = 0, (10.20) 


рага cada à є [0,1]. El conjunto {х(А) |0 < А < 1} se puede observar como una 
curva еп R” desde х(0) hasta x(1) = x* parametrizada рог A. Un método de conti- 
nuación encuentra una sucesión de pasos a lo largo de esta curva correspondiente a 
{x (àz) Ko, donde ào =0 <А < -++ < Àm = 1. 

Si las funciones А > x(A) y G son diferenciables, entonces derivar la ecuación (10.20) 
respecto a A nos da 


IG(A,X(A))  IGA,XA), 
= + х 


0 дА дх 


(А), 


y resolver рага x'(A) nos da 


EA IGA, х(А)) 


/ 
А = 
к дх дА 


Este es un sistema de ecuaciones diferenciales con la condición inicial х(0). 
Puesto que 


С(А, х(А)) = Е(х(А)) + (А — ПЕ(Х(0)), 


podemos determinar tanto 


д д д 
"Л 0) ЭЛ оуу Л хо) 
ХІ 0X2 дх, 
afa afa д/› 
So, «йе Эх 0) а Эх, (х(А)) 1). 
д п д п д п 
23 (х(А)) f (x0)) $ (х(А)) 
X1 дхә дх, 
la matriz jacobiana como 
ОС (А, x(A)) Е 
= = F(x(0)). 
Por lo tanto, el sistema de ecuaciones diferenciales se convierte en 
x) = [J&A] FO), para 0O<1A<l, (10.21) 


con la condición inicial x(0). El siguiente teorema (consulte [OR], pp. 230-231) da las con- 
diciones en las que el método de continuación es factible. 


Sea F(x) continuamente diferenciable en x € R”. Suponga que la matriz jacobiana J(x) 
es no singular para todas las х є R” y que la constante M existe соп ||J(x)7! || < М, para 
todas las х € R”. Entonces, para cualquier х(0) еп R”, existe una única función х(А), tal que 


GA, х(А)) = 0, 
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para toda 4 en [0, 1]. Además, x(à) es continuamente diferenciable y 


Х'(А) = -J &(A) Е(х(0)), рага cada à є [0, 1]. п 


Lo siguiente muestra la forma del sistema de ecuaciones diferenciales relacionadas con 
un sistema de ecuaciones no lineales. 


Ilustración Considere el sistema no lineal 


Л Ол, x2, x3) = 3x1 — cos(x213) — 0.5 = 0, 


Б(ху, х2, х3) = x? — 81 (x2 +0.1)? + sen x3 + 1.06 = 0, 


ЕЕ 107 – 3 
Ол, x2, Хз) =е е +20x3 + ооа =0. 
La matriz jacobiana es 
3 хз SON X2X3 X2 SON X2X3 
J(x) = 2x1 —162(х + 0.1) COS Хз 
=y “1% Mera 20 
Sea x(0) = (0,0,0)', así que 
—1.5 
Е(х(0)) = 0.25 
107/3 
El sistema de ecuaciones diferenciales es 
xi ОУ 3 X3 SEN X2X3 X2 SEN X2X3 IF —15 
(л | =-= 2x1 —162(x2 + 0.1) COS x3 0.25 п 
х0) —x e Un —=x e un 20 


107/3 


En general, el sistema de ecuaciones diferenciales que necesitamos resolver para nuestro 
problema de continuación tiene la forma 


dx; 
di = Фі (А, X1, X2, ees ‚ Xn), 
dx 
BD. = PA, X1, X2, ees ‚ Xn), 


ах, 
TE а фаб h 
donde 
A) Л @(0)) 
= a - D (10.22) 
фаб...) LEO) 


Para usar método Runge-Kutta de orden 4 en la resolución de este sistema, primero 
seleccionamos un entero № > 0 y establecemos que Л = (1 —0)/N. La partición del inter- 
valo [0, 1] en N subintervalos con los puntos de malla 


м = Jh, рага сайа ¡=0,1,...,N. 
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Usamos la notación w;¡ рага cadaj=0,1,...,Nyi=l,...,n, para denotar una aproxi- 
mación para х;(^;). Para las condiciones iniciales, establecemos 
wo = х1(0), w20=xX2(0), ..., Wno=Xn(0). 


Suponga que se ha calculado w1,j, иэ, у, ..., мп, у. Obtenemos и, р, W2,j4l> +--> 
Wn, ¡+1 Usando las ecuaciones 


kii = Афі(А з, Wij Мо, р... Waj) para cada к= 1,2, ss TD 


А 1 1 
kzi = ho; (a, + 5:014 + ¿A Doa ‚Ул, + ztia) para cada і = Lia 5 №5 


I 1 1 
k3 i = Аф; (a, + 5:01 + Кыз: „п, + 5), рага сайа і = 1, 2,..., п; 


Kai = АФ (àj +h, w1,j + Кз, W2,j + Ёзо,... ,Wn j +k3n ), para cada i = 1, 2,..., п; 


y, finalmente, 


1 
Wiji = Wij + 6 (Кы: + 20: + 2k3 i + ka.i) $ para cada i = 1, 2, Г (78 


La notación de vector 


Кул k21 Кз Кал №1.) 

Ко k22 k32 k42 Wa j 
kı =  LbKk=| . |, k= ‚ LbKi=| ‚ | y w= 

Kin Коп Кзп Кап Уп, ј 


simplifica la presentación. Entonces la ecuación (10.22) nos da х(0) = x(A0) = Wo, y por 
cada j = 0, 1,..., N, 


ф1 (Ар, Wijs- Wn,j) 


фо (А j, Мр. „№, ) 
kı h J s J 


=h [-J (wij, --- ,Wn.j)]  Е(х(О)) 
ф,(А у, Wij йа Wn,j) 


= h [-J(w;)] | Е(х(0)), 


а 1 
ы (+ зк) F&O), 


= =f 
„=й ы (+) F&O), 


k4 = h [-J (w; + ка) | F&(0)), 


1 1 
Х(А н) = X(å;) + 6 (kı + 28 + 2k; + k4) = wj + 6 (К, + 2k> + 2k; + k4). 


Finalmente, х(А,) = х(1) es nuestra aproximación рага х“. 
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Ejemplo 1 Use el método de continuación con x(0) = (0, 0, 0) para aproximar la solución de 
Л (х1, x2, x3) = 3x1 — cos(x2x3) — 0.5 = 0, 


fŒ, X2, х3) = x? — 81 (x2 +0.1)? + sen x3 + 1.06 = 0, 


5 107 — 3 
ЛБ, X2, x3) =e 124 20x3 + =0. 
Solución La matriz jacobiana es 
3 Хз SON X2X3 Хә SON X2X3 
Ј(х) = 2x1 —162(x2 + 0.1) COS ХЗ 
—xe *!*? =x eu 20 
y 
F(x(0)) = (1.5, 0.25, 107/3). 
Con N = 4 y h = 0.25, tenemos 
з © 0 Е 
kı =/Л[—/(х®)]!Е(х(0))=025| 0 -162 1 0.25 
0 0 20 107/3 


= (0.125, —0.004222203325, —0.1308996939)', 
К = h[—J(0.0625, —0.0021 11101663, —0.06544984695)]”*(—1.5, 0.25, 10л/3)' 


3 —0.9043289149 х 10-5 —0.2916936196 x 1056 ] * [—1.5 
= 0.25 0.125 —15.85800153 0.9978589232 0.25 
0.002111380229 —0.06250824706 20 107/3 


= (0.1249999773, —0.00331 1761993, —0.1309232406)', 

k; = h[—J (0.06249998865,—0.001655880997,—0.0654616203)]7' (—1.5, 0.25, 10л/3)' 
= (0.1249999844, —0.003296244825, —0.130920346)', 

Ка = h[—J(0.1249999844, —0.003296244825, —0.130920346)] 7! (—1.5, 0.25, 107/3) 
= (0.1249998945, —0.00230206762, —0.1309346977)', 


1 
x(à1) = № = Wo + ¿a + 2k) + 2k; + k4) 
= (0.1249999697, —0.00329004743, —0.1309202608)'. 
Al continuar, tenemos 


x(à2) = W2 = (0.2499997679, —0.004507400128, —0.26185576197, 
х(Аз) = жз = (0.3749996956, —0.003430352103, —0.3927634423)', 


x(à4) = x(1) = w4 = (0.4999999954, 0.126782 х 107”, —0.5235987758)'. 


Estos resultados son muy precisos porque la solución real es (0.5, 0, —0.52359877)'. п 
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Observe que en el método de Runge-Kutta, los pasos similares a 
k; = h[-J(x04) + 0-1K;-1)]7 F(x(0)) 
se pueden escribir como solución para К; en el sistema lineal 
J (х(А:) + 0-1K;-1)k; = —AF(x(0)). 


Por lo que en el método Runge-Kutta de orden 4, el cálculo de cada w; requiere resolver 
cuatro sistemas lineales, cada uno al calcular Ку, k2, Кз y k4. Por lo tanto, para usar N pasos 
se requiere resolver 4N sistemas lineales. Por comparación, el método de Newton requiere 
resolver un sistema lineal por iteración. Por tanto, el trabajo relacionado con el método de 
Runge-Kutta es aproximadamente equivalente a 4N iteraciones del método de Newton. 

Una alternativa es usar el método de Runge-Kutta de orden 2, de tal forma que el méto- 
do de Euler modificado o incluso el método de Euler, para disminuir el número de sistemas 
lineales que se tienen que resolver. Otra posibilidad es usar valores más pequeños de N. Lo 
siguiente ilustra estas ideas. 


Ilustración La tabla 10.6 resume una comparación del método de Euler, el método de punto medio y 
el método de Runge-Kutta de orden 4 aplicado al problema en el ejemplo, con una aproxi- 
mación inicial х(0) = (0, 0, 0). La columna а la derecha en la tabla enumera el número de 
sistemas lineales que se requieren para la solución. н 

Tabla 10.6 

Método N x(1) Sistemas 
Euler 1 (0.5, –0.0168888133, —0.5235987755)' 1 
Euler 4 (0.499999379, —0.004309160698, —0.523679652)' 4 
Punto medio 1 (0.4999966628, —0.00040240435, —0.523815371)' 2 
Punto medio 4 (0.500000066, —0.00001760089, —0.5236127761)' 8 
Runge-Kutta 1 (0.4999989843, —0.1676151 х 107%, —-0.5235989561)' 4 
Runge-Kutta 4 (0.4999999954, 0.126782 х 1077, —-0.5235987758)' 16 


El método de continuación se puede usar como un método independiente y no requiere 
una selección particularmente buena de х(0). Sin embargo, el método también puede usarse 
para proporcionar una aproximación inicial para los métodos de Newton o Broyden. Por 
ejemplo, el resultado obtenido en el ejemplo 2 usando el método de Euler y N = 2 podría ser 
fácilmente suficiente para iniciar los métodos de Newton o Broyden más eficientes y podrían 
ser mejores para este objetivo que los métodos de continuación, lo cual requiere más cálcu- 
los. El algoritmo 10.4 es una implementación del método de continuación. 


Algoritmo de continuación 


Para aproximar la solución del sistema no lineal F(x) = 0 dada una aproximación inicial x: 


ENTRADA número n de ecuaciones y de incógnitas; entero N > 0; aproximación inicial 
[4 

х= (х1, X2,..., Xp) > 

SALIDA solución aproximada х = (х1, х2,..., Xp). 


Paso 1 Determine h =1/N; 
b = —ЛЕ(х). 


Paso 2 Para i = 1,2,... , N haga los pasos 3—7. 
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Paso 3 Determine А = J (х); 
Resuelva el sistema lineal Akı = b. 


Paso 4 Determine А = J(x+ К); 
Resuelva el sistema lineal АК» = b. 


Paso 5 Determine А = J (x + tkv); 
Resuelva el sistema lineal Ak; = b. 


Paso 6 Determine А = J (х + k3); 
Resuelva el sistema lineal АК» = b. 
Paso 7 Determine x = x + (kı + 2k2 + 2k3 + k4)/6. 


Paso 8 SALIDA (хі, хо,..., Xn); 
PARE. ш 


La sección Conjunto de ejercicios 10.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


ж 10.6 Software numérico 


El paquete Hompack en Netlib resuelve un sistema de ecuaciones no lineales al utilizar va- 
rios métodos de homotopía. 

Los sistemas no lineales en las bibliotecas IMSL y NAG usan el método Levenberg- 
Marquardt, que es un promedio ponderado del método de Newton y el método de descenso 
más rápido. El peso se sesga hacia el método de descenso más rápido hasta que se detecta 
la convergencia, tiempo en el que el peso cambia hacia un método de Newton que converge 
más rápido. En cualquier rutina, se puede usar una aproximación de diferencia finita para el 
jacobiano o una subrutina proporcionada por el usuario para calcular el jacobiano. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


11 


Problemas de valor en la frontera para 
ecuaciones diferenciales ordinarias 


Introducción 


Un problema común en ingeniería civil concierne a la deflexión de una viga de sección trans- 
versal rectangular sujeta a carga uniforme, mientras los extremos de la viga están sujetos de 
tal forma que no sufren deflexión. 


=y 


w(x) 


Suponga que /, q, E, S e I representan, respectivamente, la longitud de la viga, la intensi- 
dad de la carga uniforme, el módulo de elasticidad, el esfuerzo en los extremos y el momento 
central de inercia. La ecuación diferencial que aproxima la situación física es de la forma 

dw S qx 
— (x) = —w (x) + — (x – 0), 
PT EI б) ЭЗЕТ“ ) 
donde w(x) es la deflexión de una distancia x desde el extremo izquierdo de la viga. Puesto 
que no se presenta deflexión en los extremos de la viga, existen dos condiciones en la fron- 
tera: 


w(0)=0 у w(1)=0. 


Cuando la viga tiene un grosor uniforme, el producto El es constante. En este caso, la 
solución exacta se obtiene fácilmente. Cuando el grosor no es uniforme, el momento de 
inercia / es una función de x, y se necesitan técnicas de aproximación. Los problemas de este 
tipo se consideran en el ejercicio 7 de la sección 11.3, en el ejercicio 6 de la sección 11.4 y 
en el ejercicio 7 de la sección 11.5. 

Las ecuaciones diferenciales en el capítulo 5 son de primer orden y tienen una condición 
inicial que satisfacer. Más adelante en ese capítulo observamos que las técnicas se podrían 
ampliar a los sistemas de ecuaciones y, después, a ecuaciones de orden superior, pero todas 
las condiciones específicas están en el mismo extremo. Estos son problemas de valor ini- 
cial. En este capítulo mostramos cómo aproximar la solución a los problemas de valor en 
la frontera, ecuaciones diferenciales con condiciones impuestas en diferentes puntos. Para 
ecuaciones diferenciales de primer orden, sólo se especifica una condición, por lo que no 
existe distinción entre los problemas de valor inicial y de valor en la frontera. Nosotros con- 
sideraremos ecuaciones de segundo orden con dos valores en la frontera. 

A menudo, los problemas físicos que dependen de la posición en lugar del tiempo se 
describen en términos de ecuaciones diferenciales con condiciones impuestas en más de un 
punto. 
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En este capítulo, los problemas de valor en la frontera de dos puntos implican una ecuaciones 
diferencial de segundo orden de la forma 


у" = fœ, y, y), paraa <x <b, (11.1) 
junto con las condiciones de frontera 


ya)=« у у(р) = В. (11.2) 


WTF 11.1 El método de disparo lineal 


Teorema 11.1 


Ejemplo 1 


El siguiente teorema establece las condiciones generales que garantizan la existencia de la 
solución para un problema de valor en la frontera de segundo orden. La prueba de este teo- 
rema se puede encontrar en [Keller, Н]. 


Suponga que la función fen el problema de valor en la frontera 
y” = f(x, y, y), paraa <x <b,con y(a) = о y уф) = В, 


es continua en el conjunto 


D = { (х, у, у) | paraa < x < р, соп -оо < y < ооу —00< у < œ}, 


y que las derivadas parciales f, y fy también son continuas en D. Si 
i) Љбх, y, y) > 0, para todas (x, y, y) € D, y 


ii) existe una constante M, con 


de, y, y)| < M, para todas (x, y, y”) € D, 
entonces el problema de valor en la frontera tiene una única solución. ш 


Use el teorema 11.1 para mostrar que el problema de valor en la frontera 


у! +e™ + ѕеп у = 0, paral <x < 2, соп у(1) = у(2) = 0, 


tiene una única solución. 


Solución tenemos 


f(x, y, y) = —e™™® — sen у! 


y, para todas las x en [1, 2], 


xy 


Ay y)=xec 9 >0 y |» Gx, y, y)| =|-—cosy'| < 1. 


Por lo que el problema tiene una única solución. п 


Una ecuación lineal implica 
solamente potencias lineales de y 
y sus derivadas. 


Corolario 11.2 
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Problema lineal de valor en la frontera 
La ecuación diferencial 
у" = f(x, y, y) 
es lineal cuando las funciones p (x), q (x) у r (x) existen con 
FG, y, y) = р(х)у + 4(х)у Hra). 


Los problemas de este tipo se presentan con frecuencia y en esta situación el teorema 11.1 
se puede simplificar. 


Suponga que el problema lineal de valor en la frontera 


y” = р(х)у +q(0)y +r(x), cona <x < b, con y(a) = о y y(b) = В, 
satisface 
1) р(х), 4(х), у r(x) son continuas en [a, b], 
i) qŒ) > Оеп [a,b]. 


Entonces el problema de valor en la frontera tiene una única solución. ш 


Para aproximar la solución única de este problema lineal, primero consideramos los 
problemas de valor inicial 


у" = р(х)у +q()y+r(),con a<x<b, у(а) =а,у y(a)=0, (11.3) 
y 
у” = р(х)у +q(x)y,con as<x<b, у(а) = 0,у y (a = 1. (11.4) 


El teorema 5.17 en la sección 5.9 (consultar la página 248) garantiza que de acuerdo con la 
hipótesis en el corolario 11.2, ambos problemas tienen solución única. 

Sea que у (х) denota la solución para la ecuación (11.3) y sea que уз (х) denota la so- 
lución para la ecuación (11.4). Suponga que y2(b) -# 0. (Que y2(b) = 0 está en conflicto 
con la hipótesis del corolario 11.2 se considera en el ejercicio 8.) Defina 


В — y1(b) 


Я 11.5 
УБ) у(х) (11.5) 


у(х) = у(х) + 


Entonces у (х) es la solución del problema lineal en la frontera (11.3). Para observarlo, pri- 
mero note que 


В — y1(b) 


у(х) = у(х) + УБР) у(х) 
y 
" " p= (b) " 
y) = уб) + E о). 


Al sustituir para уу (x) у y}(x) en esta ecuación obtenemos 


В — y1(b) 


20) (р(х)у + q(x)y2) 


у” = р(х)у +906)y + г(х) + 


B=y1(b) , 
A) +q(x) (» + 


= р(х)у'(х) + 4(х)у(х) + (х). 


В — y1(b) 


(5) 1) +r(x) 


= р(х) (х + 
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Este “disparo” golpea el objetivo 
después de un disparo de 
prueba. En la siguiente sección 
observamos que problemas no 
lineales requieren múltiples 
disparos. 


Figura 11.1 


Además, 
B=y1(b) B- yib) 
у(а) = y (a) + ЭФ) y.(a) = о + а) 
y 
— Ь 
OO = н и 


y2(b) 


Disparo lineal 


El método de disparo para ecuaciones lineales está basado en el reemplazo del problema 
lineal de valor en la frontera mediante los dos problemas de valor inicial (11.3) y (11.4). 
Existen numerosos métodos a partir del capítulo 5 para aproximar las soluciones у(х) y 
y(x) y una vez que estas aproximaciones están disponibles, la solución para el problema de 
valor en la frontera se aproxima usando la ecuación (11.5). Gráficamente, el método tiene el 
aspecto mostrado en la figura 11.1 


В = yib) 
y2(b) 


узо) 


уб) = у(х) + 


El algoritmo 11.1 usa la técnica Runge-Kutta de cuarto orden para encontrar la aproxi- 
mación рага у(х) y y2(x), pero otras técnicas para aproximar las soluciones para problemas 
de valor inicial se pueden sustituir en el paso 4. 

Primero, escribimos la ecuación (11.3) como un sistema de dos ecuaciones diferenciales 
al permitir zı (x) = у(х) у 22(х) = y'(x) de tal forma que 

2 (x) = z2x) 
(Хх) = р(х)2(х) + 4(х)21(х) +r (x) 
paraa < x < b con zı (a) = о y z2(a) = 0. A continuación, escribimos la ecuación (11.4) 


como un sistema de dos ecuaciones diferenciales lineales haciendo z3(x) = y(x) y z4(x) 
= y'(x) de tal forma que 


23 (x) = z4(x) 
246) = р(х)24(х) + q (х):3(х) 


paraa < x < b con z3(a) = О y za(a) = 1. Las aproximaciones calculadas en el algo- 
ritmo son 


uii X zai) = yi), uzi S zaxi) = yi (0) 
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y 
vii А z3 (xi) = уо (1), ъз Y 24001) = ул О). 
Las aproximaciones finales son 
В = uin 
Wii = uii + 2—0 59 у(х) 
ШИЛ 

y 

Ê — uin 


f 
W2, = Из + 7—0 xX у(х) 
1,N 


El algoritmo tiene la característica adicional de obtener aproximaciones para la derivada 
de la solución del problema de valor en la frontera, así como para la solución del problema 
mismo. El uso del algoritmo no está restringido a los problemas para los que las hipótesis del 
corolario 11.2 se pueden verificar; sería útil para muchos problemas que no satisfacen estas 
hipótesis. Un ejemplo de este tipo se puede encontrar en el ejercicio 4. 


Disparo lineal 
Para aproximar la solución del problema de valor en la frontera 
=y" + pœ)y'+q(x)y+r(x)=0, paraa <x < b, con y(a) = ау y(b) = B, 


(Nota: Las ecuaciones (11.3) y (11.4) se escriben como sistemas de primer orden y se 
resuelven.) 


ENTRADA extremos а, b; condiciones de frontera а, В; número de subintervalos N. 


SALIDA aproximaciones у} ; para у(х); wz ¡para y'(x;) por cada i = 0, 1,..., N. 


Paso 1 Determine h = (b—a)/N; 


uio = Q; 
ило = 0; 
vio = 0; 
v2,0 = 1. 


Paso 2 Parai=0,...,N-— 1 Һара los pasos 3 y 4. 
(Se usa el método Runge-Kutta para sistemas en los pasos 3 y 4.) 


Paso З Determine x =a + ih. 
Paso 4 Determine Күү = Лиз; 
ki2 = h [р(Х)из +4 (х)и г + г(х)]; 
Юл = h [uzi + 52]; 
юз = h [р(х + h/2) (uzi + К) 
+g(x + h/2) (uii + ал) +r(x+h/2)]; 
за = [uz + 502]: 
зо = h [р(х +h/2) (из + 4k22) 
+4(х +h/2) (uii + Юл) +0 + А/2)]; 
ka. = h [из + 32]; 
k42 = h [р(х + һ)(из + k32) ++ 4(Х + Р) (и + зл) +0 + А); 
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Ejemplo 2 


Uiii = иын + $ [ki + 2k21 + 2k3,1 + Ка]; 
Unir = изи + $ [ki 2 + 2k22 + 2Кз + Кд]; 
kia = о; 


Ко = ћ [pvi + qavi]; 
kha = h [vi + 50]; 
kha = h [р(х + А2) (о + 32) +90 + А2) (vii + 3k; ,)): 
kha = h [02 + 1); 
kia =h [р(х +h/2) (vai +14 2) + 4(х + А/2) (vii + ЪЁ |)]; 
k =h [v м +]; 
Као = [р (В +k, 3) + qŒ + o + kh1); 
vii + g [йл +26 4281 + k41]; 
V2i+1 = vi tg L [ki 2 + 2kh 7 + 2k + k42]. 


Paso 5 Determine уо = 0; 
p= UIN, 


vi i+ = 


w20 = 
V1, N 
SALIDA (а, мо, W2,0). 
Paso 6 Parai = 1,..., N 
determine W1 = и; + W2001 5; 
W2 = изә + W2,002,i; 


х=а+їһ, 
SALIDA (х, W1, W2). (La salida es xi, м, мә.) 
Paso 7 PARE. (El proceso está completo.) a 


Aplique la técnica de disparo lineal con N = 10 al problema de valor en la frontera 


2 2 1 
Y O, раа хх «2, опу) =1у70)=2, 


y compare los resultados con los de la solución exacta 


+ E с sen (In х) ` cos(ln x) 
=сх+— — — =— , 
малат; 10 


donde 


1 
Q = 7018 — 12 sen(In 2) — 4 cos(In 2)] ~ —0.03920701320 


11 
СІ = 10 7 c2 = 1.1392070132. 


Solución Aplicar el algoritmo 11.1 a este problema requiere aproximar las soluciones para 
los problemas de valor inicial 


2 2 sen (ln x 
Y =- + + a | ptr dci 
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Si esta técnica de disparo inverso sigue dando la cancelación de los dígitos significativos y si 
el incremento de precisión no arroja mayor exactitud, es preciso usar otras técnicas. Algunas 
de ellas se presentan más adelante en este capítulo. Sin embargo, en general, si u; y v] ¿son 
O(h”) aproximaciones para у; (xi) y y2(x;), respectivamente, para cada i =0,1,...,N, 
entonces w y ¡será una aproximación O(h”) para у(х). En particular, 


01; 


[ит = у) < Kh” |1 + 


3 


01,№ 


рага alguna constante К (consulte [IK], р. 426). 


La sección Conjunto de ejercicios 11.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN s 11.2 El método de disparo para problemas no lineales 


La técnica de disparo para el problema no lineal de valor en la frontera de segundo orden 


y" = f(x, y, y), paraa <x < b, con y(a) = о y y(b) = В, (11.6) 
es similar a la técnica lineal, excepto que la solución para un problema no lineal no se puede 
expresar como una combinación lineal de soluciones para dos problemas de valor inicial. 
Por el contrario, aproximamos la solución al problema de valor en la frontera por medio de 
las soluciones para una sucesión de problemas de valor inicial que implican un parámetro t. 
Estos problemas tienen la forma 


y” = Р(х, у, у), paraa <x < b,con y(a) =0 y y'(a) =t. (11.7) 


Lo hacemos al seleccionar los parámetros t = t de forma que se garantiza 
lím уф, 4) = y(b) = В, 
k=>00 


donde y(x, t) denota la solución del problema de valor inicial (11.7) con t = t y у(х) denota 
| а la solución del problema de valor en la frontera (11.6). 
problemas no lineales requieren A й б к E А 
¡teraciones para acercarse al Esta técnica recibe el nombre de método de “disparo” por la analogía con el procedi- 
“objetivo”. miento de disparar a objetos en un objetivo inmóvil. (Consulte la figura 11.2.) Comenzamos 
con un parámetro to que determina la elevación inicial a la que se dispara al objeto desde el 
punto (a, о) y a lo largo de la curva descrita por medio de la solución del problema de valor 
inicial: 


Los métodos de disparo para los 


у” = Р(х, y, у), paraa <x < b,cony(a) = « y y'(a) = to. 


Figura 11.2 


(b, уф, 10)) 


у(х, to) 


Pendiente to 


Figura 11.3 


11.2 El método de disparo para problemas no lineales 513 


Si y(b, to) no está suficientemente cerca de В, corregimos nuestra aproximación al selec- 
cionar elevaciones 1, t2, y así sucesivamente, hasta que y(b, т) esté suficientemente cerca de 
“golpear” В. (Consulte la figura 11.3.) 

Para determinar los parámetros tę, suponga que un problema de valor en la frontera de 
la forma (11.6) satisface las hipótesis del teorema 11.1. Si y(x, £) denota la solución del pro- 
blema de valor inicial (11.7), a continuación determinamos ѓ соп 


y(b,t) – В =0. (11.8) 


Ésta es una ecuación no lineal en la variable г. Los problemas de este tipo se considera- 
ron en el capítulo 2 y existen diferentes métodos. 

Para utilizar el método de la secante para resolver el problema, necesitamos seleccionar 
aproximaciones iniciales ty y t1, y, después, generar los términos restantes de la sucesión а 
través de 


(y(b, tk-1) — 8)(%—1 — tk-2) 
y(b, tk—1) т y(b, tk—2) 


E resa 


YA 


y(b, 1,) 2] 


y(b, t3) 4 Убх, t3) 
y(b, ti) 4 у(х, o. 27 


УФ, to) - 21 н 


Iteración de Newton 


Para usar el método de Newton más poderoso para generar la sucesión {7}, sólo se necesita 
una aproximación inicial ѓо. Sin embargo, la iteración tiene la forma 


y(b, 0-1) — В 


7 (11.9) 
D (Б, 1) 


tk = tk-1 — 


y requiere el conocimiento de (dy/dt)(b, tk-1). Esto presenta una dificultad porque no 
se conoce una representación explícita para y(b,t); solamente conocemos los valores 
y(b, to), y(b, t1),..., y(b, 1). 

Suponga que reescribimos el problema de valor inicial (11.7), al enfatizar que la solu- 
ción depende tanto de x como del parámetro t: 


y"(x,t) = f(x, убх, t), y (x,t)), paraa < x < b, con y(a, t) =0 y y(a,t) =t. 
(11.10) 
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Paso 1 Determine h = (b — a)/N; 
k=l; 
TK = (В —0)/(b—a). (Nota: TK también podría ser una entrada.) 


Paso 2 Mientras (k < M) haga los pasos 3-10. 


Paso 3 Determine уо = g; 


w2, = TK; 
иу =0; 
и? = 1. 


Paso 4 Рага і = 1,... , N haga los pasos 5 y 6. 
(Se utiliza el método Runge-Kutta para sistemas en los pasos 5 y 6.) 


Paso 5 Determine x =a + (i — 1)h. 
Paso 6 Determine Ку = ћу 1; 

Кыз = hf (x, W1.i-1, 2,2-1); 

Юл =h (wz: + 5k12); 

Ко = hf (x +h/2, ит +3 112,51 + $ki2); 

зл = h (w2i-1 + 102); 

зо = hf (x + h/2, эн 1 + k21, ио + 3k2.2); 

Кал = h(w2,i-1 + Кз); 

k42 = hf (x + h, 1—1 + з, W2,i-1 + Кз); 

Wii = Wi ¡1 + (Куу + 2k21 +2K3 1 + k4,1)/6; 

W2,i = W2,i—1 + (k12 + 2k2,2 + 2k3,2 + k4,2)/6; 

kia = hu»; 

kia = Alfy, тт, W2,-1)41 
+ fy X, W1,i—1, W2,i-1)u2]; 

khi = h [uz + 3k; 2]; 

kha = h [у(х + h/2, и, ио) (u1 + 3K; |) 
+ fy Œ +h/2, а, 2,1) (u2 + 10 2)); 

KB = h (uz + 4k43); 

ka = h [0 +h/2, и, ио) (и + 343 |) 
+ fy (Œ +A/2, ют, W2,-1) (u2 + 33 2)); 

Ыы, = и +); 

Ко = h [fy Œ +h, ит, W21) (и +3 1) 
+fy Œ +h, ют, №21) (u2 + k4 2)]; 

ui = ш + 1 +261 +261 + k41]; 

из = из + Ю > + 2k 3 + 2k} 2 + k42]. 

Paso 7 Si [иу y — В| < TOL entonces haga los pasos 8 y 9. 


Paso8 Parai=0,1,...,N 
determine x =a + ih; 
SALIDA (х,у, W2,5). 


Paso 9 (El procedimiento está completo .) 
PARE. 
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Ejemplo 1 


Tabla 11.2 


Раѕо 0 Determine TK = TK — PLN =P, 
ui 


(Se utiliza el método de Newton para calcular TK.) 
k=k+1. 
Paso 11 SALIDA (‘Número máximo de iteraciones excedido’); 
(El procedimiento no fue exitoso .) 
PARE. E 


El valor tọ = TK seleccionado еп el paso 1 es la pendiente de la recta que pasa por 
(a, œ) y (b, В). Si el problema satisface la hipótesis del teorema 11.1, cualquier selección 
de tọ proporcionará convergencia, pero una buena selección de ѓо mejorará la convergencia 
y el procedimiento funcionará para muchos problemas que no satisfacen esta hipótesis. Un 
ejemplo de este tipo se puede encontrar en el ejercicio 3d). 


Aplique el método de disparo con el método de Newton al problema de valor en la frontera 
„ 1 3 / 43 

y = Aa = уу), рио 
Use N = 20, М = 10, у TOL = 10-5 y compare los resultados con la solución exacta 
у(х) = х2 + 16/х. 
Solución Necesitamos aproximar las soluciones de los problemas de valor inicial 

Д 1 3 / / 

у ¿0390 prox <3, com y 0) = у (1) =й, 

у 

д д 1 

з= ч сша (ус + у), para 1<х <3,conz(1)=0y2'(1)=1, 

ду ду' 8 

en cada paso еп la iteración. Si la técnica de paro еп el algoritmo 11.2 requiere 
Iwin (1) — у(3)| < 107, 

entonces necesitamos cuatro iteraciones y t4 = — 14.000203. Los resultados obtenidos para 
este valor de t se muestran en la tabla 11.2. 
Xi Wii у(х) Iwi; — уб) 
1.0 17.000000 17.000000 
1.1 15.755495 15.755455 4.06 x 10% 
1.2 14.773389 14.773333 5.60 x 1075 
1.3 13.997752 13.997692 5.94 х 107 
14 13.388629 13.388571 5.71 х 107 
1:5 12.916719 12.916667 5.23 х 1075 
1.6 12.560046 12.560000 4.64 х 1075 
17 12.301805 12.301765 4.02 x 107% 
1.8 12.128923 12.128889 3.14 x 1075 
1.9 12.031081 12.031053 2.84 x 1075 
2.0 12.000023 12.000000 2.32 х 105 
2.1 12.029066 12.029048 1.84 x 1075 
2.2 12.112741 12.112727 1.40 x 1075 
23 12.246532 12.246522 1.01 x 1075 
2.4 12426673 12.426667 6.68 х 10-6 
2.5 12.650004 12.650000 3.61 х 1076 
2.6 12.913847 12.913845 9.17 х 1077 
2.7 13.215924 13.215926 1.43 х 107 
2.8 13.554282 13.554286 3.46 х 1076 
2.9 13.927236 13.927241 5.21 х 10-6 


3.0 14.333327 14.333333 6.69 х 10-6 
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A pesar de que el método de Newton que se usó con la técnica de disparo requiere la so- 
lución de un problema de valor inicial adicional, por lo general dará convergencia más rápida 
que el método de secante. Sin embargo, ambos métodos sólo son localmente convergentes 
porque requieren buenas aproximaciones iniciales. 

Para un análisis general de la convergencia de las técnicas de disparo para los problemas 
no lineales, se refiere al lector al excelente libro de Keller [Keller, H.] En esa referencia se 
analizan condiciones de frontera más generales. También se debe observar que la técnica de 
disparo para los problemas no lineales es sensible a los errores de redondeo, en especial si las 
soluciones y(x) y z(x, t) son funciones de x que crecen rápidamente en [a, b]. 


La sección Conjunto de ejercicios 11.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


11.3 Métodos de diferencias finitas para problemas lineales 


Los métodos de disparo lineal y no lineal para los problemas de valor en la frontera pueden 
presentar problemas de inestabilidad. Los métodos en esta sección tienen mejores caracte- 
rísticas de estabilidad, pero, en general, requieren más cálculos para obtener una exactitud 
específica. 

Los métodos que implican diferencias finitas para resolver los problemas de valor en la 
frontera reemplazan cada una de las derivadas en la ecuación diferencial con una aproxima- 
ción de cociente de diferencia adecuada del tipo considerado en la sección 4.1. El cociente de 
diferencia particular y la longitud de paso h se seleccionan para mantener un orden específi- 
co de error de truncamiento. Sin embargo, h no se puede elegir demasiado pequeña debido a 
la inestabilidad general de las aproximaciones de la derivada. 


Aproximación discreta 


El método de diferencias finitas para el problema lineal de valor en la frontera de segundo 
orden, 


у” = р(х)у + а(х)у +r(x), paraa < x < b,con y(a) = ау y(b) = В, (11.14) 


requiere que se usen aproximaciones de cociente de diferencia para aproximar tanto y’ como y”. 
Primero, seleccionamos un entero N > 0 y dividimos el intervalo [a,b] en (№ + 1) subinterva- 
los iguales, cuyos extremos son los puntos de malla х; = а + ih, parai =0,1,...,N +1, 
donde h = (b — a)/(N + 1). Seleccionar un tamaño de longitud h de esta forma facilita la 
aplicación de un algoritmo matricial del capítulo 6, lo cual resuelve un sistema lineal que 
implica una matriz N X N. 

En los puntos de malla interior, x;, рага і = 1, 2,..., №, la ecuación diferencial a 
aproximar es 


y) = PDY бк) + q (xi) y E) +r Ох). (11.15) 
Al expandir y en el tercer polinomio de Taylor alrededor de x; evaluado en х;ф Y х;-1, 
tenemos, suponiendo que y € C*[x;_1, х1], 


h? h? ht 
yra =уб +В) = уб) + hy 00) + Y + у) + ED, 


para alguna £7 еп (x;, ху), Y 
h2 h? h 


3 4 
YE) = уб — й) = уб) — һу' 0%) + у) — У" (к) + a Gh 
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para alguna En en(xi—1, xy). $1 se suman estas ecuaciones, tenemos 
ht г 
убаны) + ya) = 2y) + y о) + DPEN + у (879), 
y al resolver рага y” (х;) obtenemos 
7 1 h? _ 
у”Оч) = ¿DG — 2у0ч) + yad- ¿DIED yP E 


Podemos usar el teorema de valor intermedio 1.11 para simplificar el término de error 
para proporcionar 


1 h? 
y" (ху) = тубин) — 2у04) + уби) 1260 (11.16) 


para alguna ё; еп (х;—1, Xi+1). Esto recibe el nombre de fórmula de diferencia centrada 
para y” (х;). 


Una fórmula de diferencia centrada para y'(x;) se obtiene de forma similar (los detalles 
se consideraron en la sección 4.1), lo cual resulta en 


1 1 h? ГА 
у Оо) = эр Уб) = y(xi-1)] — 73%), (11.17) 


para alguna n; en (Х;—1, Xi+1). 
El uso de estas fórmulas de diferencia centrada en la ecuación (11.15) genera la ecuación 


у(х) = 230) + у(х) Y (Xi41) — y (xi-1) 
h2 = p&i) 2h 


+ q(x;)y xi) 


h? 
a — D [pany a) — у® En]. 


Un método de diferencias finitas con error de truncamiento de orden O(h® resulta del 
uso de esta ecuación con las condiciones de frontera у(а) = оу y(b) = В para definir el 
sistema de ecuaciones lineales 


—Wi + 2wi = М; Wi =< Wia 
nta + py | 2 | + gw = re), (11.18) 
h 2h 


рага cadai=1,2,...,N. 
En la forma que consideraremos, la ecuación (11.18) se reescribe como 


h 2 h 2 
= ( + 5р) wi- + (2+ 4 (х) w; — ( = зра) иы = —h'r (xi), 


y el sistema de ecuaciones resultante se expresa en forma de la matriz tridiagonal N X N 


Aw =b, donde (11.19) 


Teorema 11.3 
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h 
2 + h?*g(x1) 1+ р(х) 0 а 0 
=1= рб) 2+ а(х) 1+ 5р0) 
A= Шы. м. С S 0 


=1 + 5Р(км-1) 


И КОО : >. 0 © ЇЙ = SPENS 20+ Hal) 
2 һ 
—Л°т (ху) + | 1+ р(х) |wo 
wi 2 
w2 —h?r(x2) 
w= р у b= . 
NA —h?r(xn-1) 
WN 


h 
—h’r (xn) + ( = paw wan 


El siguiente teorema establece las condiciones en las cuales el sistema lineal tridiagonal 
(11.19) tiene una única solución. Su demostración es una consecuencia del teorema 6.31 en 
la página 318 y se considera en el ejercicio 9. 


Suponga que p, q y r son continuas en [a, b]. Si q(x) > 0 en [a, b], entonces el siste- 
ma lineal tridiagonal (11.9) tiene una única solución siempre que h < 2/L, donde 
L = тӣха<х<ь р(х). и 


Se debería observar que la hipótesis del teorema 11.3 garantiza una solución única para 
el problema de valor en la frontera (11.4), pero no garantiza que y e C*[a, b]. Necesitamos 
establecer que у) es continua en [a, b] para garantizar que el error de truncamiento tiene 
orden O(h’). 

El algoritmo 11.3 implementa el método de diferencias finitas lineal. 


Diferencia finita lineal 


Para aproximar la solución del problema de valor en la frontera 
у” = р(х)у +q(x)y+r(x), paraa<x+<b,cony(a)=0 y y(b)=8: 
ENTRADA extremos a, b; condiciones de frontera а, В; entero N > 2. 


SALIDA aproximaciones у; para y(x;) рага cada i = 0, 1,...,N + 1. 


Paso 1 Determine h = (b—a)/(N + 1); 
x=a+h; 
a = 2 +h?q (x); 
bı = —1 + (1/2) p(x); 
а = -hr (x) + (1 + (А/2)р(х))а. 


Paso 2 Рагаі = 2,..., № – 1 
determine х = а + іл; 
а; = 2 + А?а(х); 
bi = —1 + (4/2) px); 
—1— (Л/2)р(х); 
di = —h?r(x). 


2 
II 
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Paso З Determine x = b — h; 
ay =2 + hq (Œ); 
Су = —1— (4/2)p(x); 
dy = —h°r (x) + (1 — (А/2)р(х))А. 


Paso 4 Determine l; = ау; (Los pasos 4-8 resuelven un sistema lineal tridiagonal 
usando el algoritmo 6.7.) 


II 


иу =b1/a1; 
zi = 4/1. 
Paso 5 Parai = 2,..., N — 1 determine l; = а; — CiUi—1; 


ui =b;/l;; 
zi = (d; = Cizi-1)/l;. 


Paso 6 Determine ly = ау — CyUy-1; 
2№ = (dy = Cnzn-1)/lN. 
Paso 7 Determine wọ = g; 
муъ = В. 
WN = ZN. 
Paso 8 Parai = N — 1,..., 1 determine w; = Zi — иги; ц. 


Paso 9 Parai = 0,..., № + 1 determine х = а + її; 
SALIDA (х, w;). 


Paso 10 PARE. (El procedimiento está completo.) ш 


Ejemplo 1 Use el algoritmo 11.3 con N = 9 para aproximar la solución del problema lineal de valor en 
la frontera 


Dd 2 sen (Un х) 
y == тру + 52° рага 1 < х < 2, соп у(1) = 1уу(2) = 2, 


y compare los resultados con los obtenidos con el método de disparo en el ejemplo 2 de la 
sección 11.1. 


Solución Para este ejemplo usaremos N = 9 por lo que Л = 0.1 y tenemos el mismo espa- 
ciado que en el ejemplo 2 de la sección 11.1. Los resultados completos se enumeran en la 


tabla 11.3. 

Tabla 13, wi у(х) Iwi — уб) 
10 1.00000000 1.00000000 
1.1 1.09260052 1.09262930 2.88 x 1075 
12 1.18704313 1.18708484 4.17 x 107? 
1.3 1.28333687 1.28338236 4.55 х 107% 
14 1.38140205 1.38144595 4.39 x 1075 
1.5 148112026 148115942 3.92 x 1055 
16 1.58235990 1.58239246 3.26 х 1077 
17 1.68498902 1.68501396 2.49 x 107° 
1.8 178888175 178889853 1.68 х 1075 
1.9 1.89392110 1.89392951 8.41 х 107% 


20 2.00000000 2.00000000 


Estos resultados son considerablemente menos exactos que los obtenidos en el ejemplo 
2 de la sección 11.1. Esto se debe a que el método que se usó en ese ejemplo implicaba una 
técnica Runge-Kutta con error de truncamiento local de orden om, mientras el método de 
diferencia que se usa aquí tiene un error de truncamiento local de orden О(Ё?). ш 
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Para obtener un método de diferencia con mayor exactitud, podemos proceder de dife- 
rentes formas. Usando la serie de Taylor de quinto orden para aproximar y”(x;) y y'(x;) en 
un término de error de truncamiento que implica л“. Sin embargo, este proceso requiere usar 
múltiplos no sólo de у(х;+1) y y (%¡-1), sino también de y(x;+2) y y(x¡-2) en las fórmulas 
de aproximación para у”(х;) y у'(х;). Esto conduce a la dificultad en і = N porque no co- 
nocemos w_, y en i = N porque no conocemos wy+2. Además, el sistema de ecuaciones 
análogas resultante para (11.19) no es de forma tridiagonal y la solución del sistema requiere 
muchos más cálculos. 


Uso de la extrapolación de Richardson 


En lugar de intentar obtener un método de diferencia con un error de truncamiento de orden 
superior de esta forma, en general, es más satisfactorio considerar una reducción del tamaño 
de longitud. Además, la técnica de extrapolación de Richardson se puede usar de manera 
efectiva para este método porque el término de error está expresado en potencias pares de h 
con coeficientes independientes de Л, siempre y cuando y sea suficientemente diferenciable 
(consulte, por ejemplo, [Keller, H], p. 81). 

El ejercicio 10 da algunas ideas respecto a la forma del error de truncamiento y la justi- 
ficación para usar la extrapolación. 


Ejemplo 2 Aplique la extrapolación de Richardson para aproximar la solución del problema de valor 
en la frontera 
” 2‚ 2 sen (lnx) 
у = у =к= у= z > para 1 <x <2,сопу(1) = 1уу(2) = 2, 
х х Ж 
usando Л = 0.1,0.05, y 0.025. 
Solución Los resultados se muestran en la tabla 11.4. La primera extrapolación es 
4w;(h = 0.05) — м; (л = 0.1) 
Ехі; = i 
3 
la segunda extrapolación es 
4w;(h = 0.025) — w; (h = 0.05) 
Extz; = 5 
3 
y la extrapolación final es 
16Extz; — Ext; 
пу Рыа лты. 
15 
Tabla 11.4 
Xi w;(h = 0.05) эё; (Л = 0.025) Ех; Exto; Exts; 
1.0 1.00000000 1.00000000 1.00000000 1.00000000 1.00000000 
1.1 1.09262207 1.09262749 1.09262925 1.09262930 1.09262930 
1.2 1.18707436 1.18708222 1.18708477 1.18708484 1.18708484 
1.3 1.28337094 1.28337950 1.28338230 1.28338236 1.28338236 
1.4 1.38143493 1.38144319 1.38144589 1.38144595 1.38144595 
1.5 148114959 148115696 1.48115937 1.48115941 1.48115942 
1.6 1.58238429 1.58239042 1.58239242 1.58239246 1.58239246 
17 1.68500770 1.68501240 1.68501393 1.68501396 1.68501396 
1.8 1.78889432 1.78889748 1.78889852 1.78889853 1.78889853 
1.9 1.89392740 1.89392898 1.89392950 1.89392951 1.89392951 
2.0 2.00000000 2.00000000 2.00000000 2.00000000 2.00000000 
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Se omiten los valores de w; (h = 0.1) en la tabla para ahorrar espacio, pero están lista- 
dos en la tabla 11.3. Los resultados para w; (h = 0.025) son exactos en aproximadamente 
3 X 107%. Sin embargo, los resultados de Ectz; son correctos para los lugares decimales 
enumerados. De hecho, si se usan suficientes dígitos, esta aproximación concordaría con 
la solución exacta con error máximo de 6.3 X 10”!! en los puntos de malla, una mejora 
impresionante. ш 


La sección Conjunto de ejercicios 11.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


11.4 Métodos de diferencias finitas para problemas no lineales 


Para el problema no lineal general de valor en la frontera 


у” = Р(х, у, у), paraa < x < b,con y(a) = а y y(b) = В, 


el método de diferencias es similar al método aplicado para problemas lineales en la sección 
11.3. Sin embargo, aquí el sistema de ecuaciones no será lineal, por lo que se requiere un 
proceso iterativo para resolverlo. 

Para el desarrollo del procedimiento, suponemos siempre que f satisface las siguientes 
condiciones: 


e fy las derivadas parciales f, y fy son todas continuas en 
D = { (х, у, у) |a <x <b,con=œ < у < ооу оо < y < оо}; 
e fy(x, y, у) > беп D, para algún ô > 0; 


e Existen constantes К y L, con 


k= máx |æ, y, y) у L= máx |f dy y). 
(х,у,у)єр (х,у,у)єр 


Esto garantiza, mediante el teorema 11.1, que existe una solución única. 
Como en el caso lineal, dividimos [a, b] en (№ + 1) subintervalos iguales, cuyos extre- 


mos están en x; = a +ih,para i = 0, 1,..., N+1. Suponer que la solución exacta tiene 
una cuarta derivada en la frontera nos permite reemplazar у” (х;) y у'(х;) en cada una de las 
ecuaciones 


у”(х') = FE у(х), y a) 


mediante la fórmula de diferencia centrada adecuada provista en las ecuaciones (11.16) y 
(11.17) en la página 518, respectivamente. Esto da, рага cada i =1,2,...,N, 


Yai) — уб) h? 
2h 6 


у(х) = 2y (xi) + y xi-1) 
2 


h2 
у") + —_ у (E), 


= Faya, 15 


para algunas ё; y n; en el intervalo (х;—1, Хъ1). 


Como en el caso lineal, el método de diferencias resulta de eliminar los términos de error 
y emplear las condiciones de frontera: 
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мтр — 2w; + Wi- Wi41 — М1 
+ f (Xr м, —— | = 0, 
h2 


para cada i = 1,2,...,N. 
El sistema no lineal N X N obtenido a partir de este método, 


2w СЕТ тта. — о = 0, 


2 W3 — W1 
—wı + 202 – мз +h*f х2, W2 — >p =0, 


(11.20) 


Wy = Wy- 
—=Wy-2 + 2wWy-1 = WN + 125 (a WN-1> "зы =0, 


—wy-1 +2wy + h? РОР аш – В = 0, 
2h 


tiene una solución única siempre y cuando h < 2/L, como se muestra en [Keller, H], p. 86. 
También, consulte el ejercicio 7. 


Método de Newton para iteraciones 


Usamos el método de Newton para los sistemas no lineales que se analizaron en la sec- 
ción 10.2 para aproximar la solución de este sistema. Se genera una sucesión de iteracio- 
ч t Fa + * 
пе$ {(w®, we, TE wE) ) que converge a la solución del sistema (11.20), siempre que 


A e, E ГА . В 
la aproximación inicial (w (0) wP, e wO) sea suficientemente cercana a la solución 


(w1, W2, ... , Wy)' y la matriz jacobina para que el sistema sea no singular. Para el sistema 
(11.20), la matriz jacobina J (w1, ... ,w y) es tridiagonal con ¡j-ésima entrada 


Wi+1 — Wj¡-1 


І 
-1+ E fy (raw | pa i= j-1yj=2. N, 


2h 
2 Wi+1 — Wi-1 Í Er 
J(W1,... им) =32 +h fy XoWo ар h para i = jyj=1,...,N, 
i h 
h Wi+1 — Wj-1 | ; 
A х р ‚рагаі= ј +1уј = 1,...,№- 1, 


donde wọ = а у муці = В. 


El método de Newton para los sistemas no lineales requiere que en cada iteración se 
resuelva el sistema lineal N X N 


J(w1, Es , У м)(@\, oeg Un) 


= – | 20) ио -а +2 [х,у moa 
1 2 а l; 1> 2h > 


2 з = W] 
= wi + 202 — из +h j (aam E 
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WN = Wy- 
2 N N-2 
—Wy-2 +2Wy-1 = WN +h СЕ > 


2h 


t4 
— wy- 
= му +2wy +h f (хх, =) = p) 


рага v1, U2,... , Uy ya que 
м = pe + 0, paracadai=1,2,...,N. 


Puesto que J es tridiagonal, esto no es un problema tan difícil como podría parecer. Еп 
particular, se puede aplicar la factorización de Crout, el algoritmo 6.7 en la página 316. El 
proceso se detalla en el algoritmo 11.4. 


Diferencia finita no lineal 
Para aproximar la solución del problema de valor en la frontera no lineal 
у” = Р(х, у, у), paraa <x < b,con y(a)=0 y y(b)=8: 


ENTRADA extremos a, b; condiciones de frontera о, В; entero N > 2; tolerancia TOL; 
número máximo de iteraciones M. 


SALIDA aproximaciones w; para y(x;) para cada i = 0, 1,...,N + 1 о un mensaje que inca 
que se ha excedido el número máximo de iteraciones. 


Paso 1 Determine л = (b — a)/(N + 1); 
wo =Q; 
Ww+1 =Ê. 


Paso 2 Para i = 1,... , N determine w; = а +i (=) 
—a 


Paso 3 Determine k = 1. 
Paso 4 Mientras k < M haga los pasos 5-16. 


Paso 5 Determine x = a + h; 
t = (w2 — 0)/Qh); 
а = 2+ h? (х, w1, Р); 
bi = —1 + (4/2) fy (x, w1, t); 
dı = – (20 = w2 = о + R’ f(x, w1, 0)). 


Paso 6 Parai =2,...,N—1 
determine x = a + ih; 
t = (иы = W¡1)/QAh); 
а; =2 + дурь wi, t); 
bi = —1 + (h/2) fy Œ, wi, t); 
ci = —1— (h/2) fy Œ, wi, t); 
di = — (2w; — ж — Wi-1 +? f(x, wi, t)). 
Paso 7 Determine x = b — h; 
t = (В — Wn-1)/Qh); 
ayn =2 + А? (х, wy, t); 
Cy = —1— (4/2) f(x, wy, t); 
dy = – (20у = жх = B+Hf(x, wn, 1). 


Ejemplo 1 
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Paso 8 Determine l; = a1; (Los pasos 8-12 resuelven un sistema lineal 
tridiagonal mediante el algoritmo 6.7.) 
ир =b1/a1; 
21 = 4/1. 
Paso 9 Рага і = 2,..., № — 1 determine l; = а; — сіи;-1; 
ш =b;/l;; 


zi = (d; = Cizi-1)/ li. 


Paso 10 Determine ly = ау — CyUy-1; 
ZN = (dy — См2м-1)/1к. 


Paso 11 Determine vy = Zy; 
WN = му + Uy. 


Paso 12 Parai=N—1,...,1l determine v; = Zi — ш 01; 
wi = Wi + vi. 


Paso 13 Si |у|| < TOL entonces haga los pasos 14 y 15. 


Paso 14 Parai=0,...,N + 1 determine x =a + ih; 
SALIDA (х, у). 


Paso 15 PARE. (El procedimiento fue exitoso.) 
Paso 16 Determine К = К + 1. 


Paso 17 SALIDA (“Número máximo de iteraciones excedido”); 
(El procedimiento no fue exitoso.) 
PARE. E 


Se puede mostrar (consulte [IK], p. 433) que este método de diferencia finita no lineal 
es de orden О(№). 

Se requiere una buena aproximación inicial cuando no se puede verificar que se cum- 
plen las condiciones (1), (2) y (3) dadas al principio de esta presentación, por lo que se debe 
especificar una cota superior para el número de iteraciones y, si se excede, se considera una 
aproximación inicial nueva o una reducción de la longitud. A menos que exista información 
contradictoria, es razonable comenzar el procedimiento al asumir que la solución es lineal. 
Por lo que, las aproximaciones iniciales w o рага w;, para cada i = 1,2,... , №, se obtiene 
en el paso 2 al pasar una línea recta a través de los extremos conocidos (a, œ) у (b, В) y al 
evaluar en x;. 


Aplique el algoritmo 11.4, con h = 0.1, para el problema no lineal de valor en la frontera 
Д 1 3 / 43 
y =¿02+ 2% — уу), рага 1 < x < 3,соп y(1) = 17у у(3) = =, 


y compare los resultados con los obtenidos еп el ejemplo 1 de la sección 11.2. 


Solución El procedimiento de paro o detención utilizado en el algoritmo 11.4 fue iterar 
hasta que los valores de iteraciones sucesivas difieran por menos de 1078. Se logró con cua- 
tro iteraciones. Esto da los resultados en la tabla 11.5. Son menos exactos que los obtenidos 
usando el método de disparo no lineal, lo cual dio los resultados de la parte media de la tabla, 
exactos en el orden de 107°. п 
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Tabla 11.5 


Tabla 11.6 


Xi Wi у(х) иг = y Gx)! 

1.0 17.000000 17.000000 

1.1 15.754503 15.755455 9.520 x 1074 

12. 14.771740 14.773333 1.594 x 107° 

13 13.995677 13.997692 2.015 x 107° 

1.4 13.386297 13.388571 2.275 x 107° 

1.5 12.914252 12.916667 2.414 х 1073 

1.6 12.557538 12.560000 2.462 x 107° 

17. 12.299326 12.301765 2.438 x 107° 

1.8 12.126529 12.128889 2.360 x 107° 

1.9 12.028814 12.031053 2.239 x 107° 

2.0 11.997915 12.000000 2.085 x 107° 

2.1 12.027142 12.029048 1.905 х 107° 

2.2 12.111020 12.112727 1.707 x 10? 

2,3 12.245025 12.246522 1.497 x 10? 

24 12.425388 12.426667 1.278 х 1075 

2 12.648944 12.650000 1.056 x 107° 

2.6 12.913013 12.913846 8.335 x 107* 

2T 13.215312 13.215926 6.142 x 107* 

2.8 13.553885 13.554286 4.006 х 1074 

2.9 13.927046 13.927241 1.953 x 107* 

30 14.333333 14.333333 

Uso de la extrapolación de Richardson 

El procedimiento de extrapolación de Richardson también se puede usar para el método de 
diferencias finitas no lineal. La tabla 11.6 enumera los resultados cuando se aplica este méto- 
do a nuestro ejemplo usando Л = 0.1, 0.05, y 0.025,), con cuatro iteraciones en cada caso. Se 
omiten los valores de w;(h = 0.1) de la tabla para ahorrar espacio, pero se listan en la tabla 
11.5. Los valores de w;(h = 0.25) son exactos dentro de aproximadamente 1.5 X 1074. Sin 
embargo, los valores de Ext3, son exactos para los lugares enumerados, con un error máximo 
actual de 3.68 х 107". 

Xi w;(h = 0.05) w;(h = 0.025) Ext, Ext», Ех 

10 1700000000 17.00000000 17.00000000 17.00000000 17.00000000 
1.1 15.75521721 15.75539525 15.75545543 15.75545460 15.75545455 
2, 14.77293601 14.77323407 1477333479 1477333342. 1477333333 
13 13.99718996 13199756690 13.99769413 13.99769242 13.99769231 
14 13.38800424 13.38842973 13.38857346 13.38857156 13.38857143 
125 12.91606471 12.91651628 12.91666881 12.91666680 12.91666667 
1.6 12.55938618 12.55984665 12.56000217 12.56000014 12.56000000 
I7 12.30115670 12.30161280 12.30176684 12.30176484 12.30176471 
1.8 12.12830042 12.12874287 12.12899094 12.12888902 12.12888889 
19 12.03049438 12.03091316 12.03105457 12.03105275 12.03105263 
20 11.99948020 11.99987013 12.00000179 12.00000011 12.00000000 
2.1 12.02857252 12.02892892 12.02902924 12.02904772 12.02904762 
2.2 12.11230149 12.11262089 12.11272872 12.11272736 12.11272727 
2.3 12.24614846 12.24642848 12.24652299 12.24652182 12.24652174 
24 12.42634789 12.42658702 12.42666773 12.42666673 12.42666667 
2:9 12.64973666 12.64993420 12.65000086 12.65000005 12.65000000 
2.6 12.91362828 12.91379422 12.91384683 12.91384620 12.91384615 
2.7 13.21577275 13.21588765 13.21592641 13.21592596 13.21592593 
2.8 13.55418579 13.55426075 13.55428603 13.55428573 13.55428571 
2.9 13.92719268 13.92722921 13.92724153 13.92724139 13.92724138 
30 14.33333333 14.33333333 14.33333333 14.33333333 14.33333333 


La sección Conjunto de ejercicios 11.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 
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11.5 El método de Rayleigh-Ritz 


John William Strutt Lord 
Rayleigh (1842-1919), un físico 
matemático que se interesaba 
especialmente en la propagación 
de ondas, recibió el Premio 
Nobel de física en 1904. 


Walter Ritz (1878-1909), un 
físico teórico en la Góttigen 
University, publicó un artículo 
sobre un problema de variación 
en 1909 [Ri]. Murió de 
tuberculosis a los 31 años. 


Teorema 11.4 


El método del disparo para aproximar la solución de un problema de valor en la frontera 
reemplazó al problema de valor en la frontera con un par de problemas de valor inicial. El 
enfoque de diferencia finita reemplaza la operación continua de diferenciación con la opera- 
ción discreta de diferencias finitas. El método Rayleigh-Ritz es una técnica de variación que 
aborda el problema desde un tercer enfoque. El problema de valor en la frontera primero se 
reformula como un problema de selección; del conjunto de todas las funciones suficiente- 
mente diferenciables que satisfacen las condiciones de frontera, se selecciona la función para 
minimizar cierta integral. A continuación, se reduce el tamaño del conjunto de funciones 
viables y se encuentra una aproximación a partir de este conjunto para minimizar la integral. 
Esto nos proporciona una aproximación para la solución del problema de valor en la frontera. 

Para describir el método Rayleigh-Ritz consideramos la aproximación de una solución 
solución de un problema de valor en la frontera en dos puntos lineal desde el análisis de 
tensión de una viga. Este problema de valor en la frontera se describe mediante la ecuación 
diferencial 


d dy 
-E (07) +q(x)y = f(x), para0<x<l, (11.21) 


con las condiciones de frontera 


y(0) = у(1) = 0. (11.22) 


Esta ecuación diferencial describe la deflexión у(х) de una viga de longitud 1 con sección 
transversal variable representada por q(x). La deflexión se debe a las tensiones añadidas p(x) 
y f(x). En los ejercicios 9 y 12 se consideran condiciones de frontera más generales. 

En el siguiente análisis suponemos que p € C*[0, 1] y q, f € C[O, 1]. Además, supo- 
nemos que existe una constante ô > 0 tal que 


р(х) > ô, удиед(х) > 0, para cada хеп [0, 1]. 


Estas suposiciones son suficientes para garantizar que el problema de valor en la frontera 
provisto en las ecuaciones (11.21) y (11.22) tiene una solución única (consulte [BSW]). 


Problemas de variaciones 


Al igual que en el caso de los problemas de valor en la frontera que describen fenómenos 
físicos, la solución de la ecuación de la viga satisface la propiedad variacional de minimi- 
zación integral. El principio variacional para la ecuación de la viga es fundamental para el 
desarrollo del método Rayleigh-Ritz y caracteriza la solución para dicha ecuación como la 
función que minimiza una integral sobre todas las funciones С2[0, 1], el conjunto de esas 
funciones и en C?[0, 1] con la propiedad u(0) = и(1) = 0. El siguiente teorema establece 
la caracterización. 


Sip e C![0, 1],q, f e C[0, 1], y 
р(х) > 8>0, q(x)>0, para0<x <1. 


La función y € Co [0, 1] es la única solución para la ecuación diferencial 


d d 
-E (rw) +q(x)y = f(x), para0< x <1, (11.23) 
dx dx 

si y sólo si y es la única función en С2[0, 1] que minimiza la integral 


1 
Ци] = / POOF + quo luto? — 2 G0)u(x) dx. (11.24) 
0 
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Los detalles de la demostración de este teorema se pueden encontrar en [Shul], p. 88-89. 
Su procedimiento consta de tres pasos. Primero se muestra que una función, y, es una solu- 
ción de la solución de la ecuación (11.23) si y sólo si satisface la ecuación 


1 1 
. / ds / PA (e) + д (к)уб)и (й, (1125) 


para toda u € с[0.1]. 


El segundo paso muestra que y € Co [0, 1] es una solución para la ecuación (11.24) si y 
sólo si la ecuación (11.25) se mantiene para toda u € С [0, 1]. 


e El paso final muestra que (11.5) tiene una solución única. Esta última también será una 
solución para (11.24) y para (11.23), de tal forma que las soluciones para las ecuaciones 
(11.23) y (11.24) son idénticas. 


El método Rayleigh-Ritz aproxima la solución y al minimizar la integral no sobre todas 
las funciones en СС[0, 1], sino sobre un conjunto pequeño de funciones que consisten en 
combinaciones lineales de ciertas funciones base фу, фә,... , фп. Las funciones base son 
linealmente independientes y satisfacen 

ф(0) = ф;(1) = 0, paracadai=1,2,...,n. 
A continuación se obtiene una aproximación ф(х) = XA i с;ф;(х) para la solución у(х) 
de la ecuación (11.23) al encontrar las constantes с, с2,..., Cn para minimizar la integral 
І [Xi cgi]. 


A partir de la ecuación (11.24) 


Пф] = [э] (11.26) 


n n 


al 2 2 n 
= / pol Pei) +4®) Vaso] 2109 у афо ) dx, 
isl 


i=1 i=1 


y, para que se presente un mínimo, es necesario, al considerar 7 como una función de 
Cis Ска: Cn tener 


д1 
— =0, рагасайа ¡=1,2,...,n. (11.27) 
дс; 


Al derivar (11.26) obtenemos 


ol 
дс) 


1 п п 
=f арау това) + 206) O 2400460 | de, 


і=1 i=l 


y al sustituir en la ecuación (11.27) se obtiene 


n 1 1 
0= 5 / POED (х) + (х) фі (х)фу(х)) axe -f Р(х)фу (х) dx, 
e (11.28) 
рага сайа ¡=1,2,...,n. 


Las ecuaciones normales descritas en la ecuación (11.28) generan un sistema lineal n X п 
Ac = b en las variables с, с2,..., Cn, donde la matriz simétrica A está dada 


1 
a= [р(х)ф;()фу(х) +a j) dx, 


y b se define como 
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1 
ps [ da 


Base lineal por tramos 


La opción más simple de las funciones base implica polinomios lineales por tramos. El 


primer paso es formar una partición de [0, 1] al seleccionar los puntos Xo, X1,..., Xn+1 CON 
O=xXx0<X1<-**< Xp < х = 1. 
Al utilizar h; = x;41 х;, para cada і =0,1,...,n, definimos las funciones base фу (x), 


P2(x),..., ф(х) mediante 


0, 51 
, (x —xi¡-1), si 
p(x) = Е 
н = х), si 
0, 51 


рага cada i = 0, 1,...‚п.(Сопиие la figura 11.4.) 


О=х < җыл, 


х1 < X <р, 


(11.29) 


Xi < X 5 Xi+l> 


Хы < xX < 1, 


En el ejercicio 13 se muestra que las funciones base son linealmente independientes. 


Figura 11.4 


у= ф1(0) 


Las funciones ф; son lineales por tramos, рог lo que las derivadas ф;, aunque no sean 


continuas, son constantes en (xj, Xj+1), para cada j =0,1,...,n, y 
0, si O<x<x;¡_1, 
1 А 
‚281 мүр < х < х, 
j Ж 
фк) = 1 (11.30) 
== si Xi < X < хт, 
hi 
0, Si Xi <x<l, 


рага сайа і = 1, 2,..., п; 
Puesto que ф; y ф! son diferentes а cero sólo en (х;—1, Xi+1), 


ói(x)p/(x)=0 y фі (х)ф (х) = 0, 
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excepto cuando j es і — 1, і, оі + 1. Como consecuencia, el sistema lineal dado por la 
ecuación (11.28) se reduce a un sistema lineal tridiagonal n X n. Las entradas diferentes a 
cero en A son 


1 
22 / (PA 09Р + ao or) ах 


1 2 рм =j 2 ех 
= | ) / р(х) ах + (=) f р(х) dx 
h;i-1 хі] hi Xi 
1 2 Xi 2 1 2 Xi41 5 
+ (5 ) / (х = х:-1)4(х) dx + (=) f (Очы = xY q(x) dx, 
1—1 Xi—1 i Xi 


para cadai=1,2,...,n; 


1 
e | {О К (к) +4 дды О) ах 


1\2 fin 1\2 pia 
=-(7) / родах + (E) f Que — х)(х — xi) (х) dx, 


para cadai=1,2,...,n— 1; у 


1 
ps ү! pora 0) 4096 Г 


1 2 "Xi 1 2 х; 
= -(; ) [| р(х) ах + (; ) I (х; = x)(x = xi-1)q4 (x) dx, 
1—1 Xi-1 1-1 х1 


рага сайа і = 2,... , п. Las entradas de b son 


1 i Xi 1 Xi+1 
bi = / FP) dx = l (к= xi) 0) dx + y J (хен — х) f Œ) dx, 
p= Xi—1 I yx; 


рага сайа і = 1, 2,...,п. 
Existen seis tipos de integrales que deben evaluarse: 


1 2 Xi41 
Оі; = (>) / (хы — x)(x — х)фд(х) ах, рагасайа i = 1, 2,...,п — 1, 


түу 
) [| (х — xi) qŒ) ах, рагасайа ¡=1,2,...,n, 
1 Xi—1 


1 2 Xi4+1 
о (у) / (хш = х)24 (х) dx, рагасайа і = 1, 2,...,п, 
2 px 
( ) / р(х) ах, рагасайа і = 1, 2,...,п +1, 
Xi—1 


1 ч 
Ооа р | (х= х1) Р(х) dx, рагасайа і = 1, 2,..., п, 
i=l /x,1 


1 


Xi+1 
бы= у | (хы х) Р(х) ах, рагасада ¡=1,2,...,n. 
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La matriz A y el vector b en el sistema lineal Ac = b tiene las entradas 


dii = Ом + Од + Оз + Озі, paracada і = 1, 2,..., п, 
а = —Q4,i+1 + О. paracada і = 1,2,...,n— 1, 


аіл = = Оа + Oiii paracada ¿=2,3,...,n, 


bi = Q5; + Ов, рагасайа ¡=1,2,...,n. 


Las entradas en e son los coeficientes desconocidos сі, C2, ... , Cn, a partir de los cuales 
n 


se construye la aproximación de Rayleigh-Ritz ф, dada por ф(х) = 5 ciQi(x), 
i=l 
El uso de este método requiere que se evalúen 6n integrales, ya sea directamente o me- 
diante una fórmula de cuadratura, como la regla compuesta de Simpson. 
Un enfoque alternativo para la evaluación integral es aproximar cada una de las funcio- 
nes p, q y f con su polinomio de interpolación lineal por tramos y, a continuación, integramos 
la aproximación. 


Considere, por ejemplo, la integral Q1,;. La interpolación lineal por tramos de q es 


п+1 


Рџ(х) = Y |4(х)ф:(х), 


ї=0 


donde ф\,..., ф, se definen en la ecuación(11.30) у 


XxX š Xx — Xn * 
, Si <x<x] 1 ‚= Si Х„<х<1 
25 Xx = = 
фо(х) == | y Pny (x) == Л 
0, еп о{то сазо 0, en otro caso. 


El intervalo de integración es [x;, x;+1], de tal forma que el polinomio por tramos Р(х) se 
reduce a 


Р(х) = q (xi) Œ) + q i)i). 


Éste es el polinomio interpolante de primer grado en la sección 3.1. Mediante el teorema 3.3 
en la página 83, 


lg (e) — P¿(x)| = O(h?), para xi < x < хл, 


siq € C?lx;, Xi+1]. Parai = 1,2,...,n — 1, la aproximación рага OQ ¡ se obtiene al in- 
tegrar la aproximación para el integrando 


1\2 poi 
о: (у) f EE а 


(хт = rask) h; + hi 


a] [“ qa), 40) —х)] 
Хх 


hi 
= 1000) + 4. 
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Además, si q € C?[x;, х;у], entonces 
hi 3 
Qu = 214%) + (Xi41)] = O(h;). 
Las aproximaciones para las otras integrales se derivan de forma similar y están dadas por 
hi- hi 
Оз: 7 18469) + q(%;-1)1, Оз: ~ pnt (б) + 9041), 


А; 
е LA) + Fria), 


1 
Ол: н PA + р(х-1)], Оз Ж 


hi 
Об: УЮ + fil. 


El algoritmo 11.5 establece el sistema lineal tridiagonal e incluye el algoritmo de factori- 
zación de Crout 6.7 para resolver el sistema. Las integrales O ;,... , Q6, ¡Se pueden calcular 
mediante alguno de los métodos antes mencionados. 


Rayleigh-Ritz lineal por tramos 


Para aproximar la solución al problema de valor en la frontera 
d dy 
—— | р(х) = | +4(x)y = f(x), раа0 < х < 1, сопу(0) =0 y y(1) =0 
dx dx 
con la función lineal por tramos 
фо) = у caga): 
¡=1 


ENTRADA entero n > 1; puntos xy = 0 < ху <<< Xn < Хы = 1. 


SALIDA coeficientes c1, ... , Cn. 
Paso 1 Рага і =0,... ‚п determine h; = хц — Xi. 
Paso 2 Рага і = 1,... ‚п definir la base lineal por tramos ф; por 
0, OE х1, 
X — Xi-1 
ко, Xi <XE<Xi, 
i—1 
ф(х) = 
Xi41 х 
————, O TA 
h; 
0, Xi4] <Х< 1. 


Paso 3 Para cada і =1,2,...,n— 1 calcule О1;, Оз, Ози, Одг, Озын. Ов; 
Calcule Оз, Оз, Ол. Од, Оз. Ов. 


Paso 4 Рагасайа i =1,2,...,n— 1, determine о; = Ол; + Олы + Оз + Озу; 


Bi = Ом = Q4,i+1; 
bi = Q5,i + Q6,i. 
Paso 5 Determine а, = Q4,n + Q4,n+1 + Оз + 0315 
bn = О5 „ + Ос п: 
Paso 6 Determine a; = о; (Los pasos 1-6 resuelven el sistema lineal tridiagonal 


simétrico usando el algoritmo 6.7.) 
¿1 =B1/01; 
zı = р/а. 
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Paso 7 Parai=2,...,n— 1 determine а; = а; — Bi-1€;-1; 
$ = В:/аг; 
zi = (bi — Bi-12i-1)/a;. 
Paso 8 Determine а, = аһ — Bn-1€n-15 
Zn = (bn Е Bn-12n-1)/4p 
Paso 9 Determine с, = Zp; 
SALIDA (с). 


Paso 10 Parai = п —1,... ,1 determine c; = Zi — сіі; 
SALIDA (c;). 
Paso 11 PARE. (El procedimiento está completo.) ш 


La siguiente ilustración usa el algoritmo 11.5. Debido a la naturaleza fundamental de 
este ejemplo, las integrales en los pasos 3, 4 y 5 se encontraron directamente. 


Ilustración Considere el problema de valor en la frontera 
—y"+1?y = 2л°зеп(тх), para0< х <1,con y(0) = y(1) =0. 


Sea h; = h = 0.1, de tal forma que x; = 0.17, para cada į =0,1,...,9. Las integrales son 


0.1:+0.1 л? 
Ош = 100 f (0.11 +0.1 — х)(х — 0.10)? dx ==, 
0.11 60 


0.11 л? 
Ом = 100 | (х —0.1i +0.1)2л? dx = —, 
0.1i—0.1 30 


0.1i+0.1 л? 
Оз: = 100 f (0.1: + 0.1 = х)?л? dx = —, 
0 30 


Li 


0.li 
Ом = 100 | dx = 10, 
0.1:—0.1 


0.1! 
Ози = 10 f (x – 0.11 + 0.1)2л2 sen 7x dx 
0.1101 


= 2л соѕ0.1лі + 20[sen(0.1ri) — sen((0.1i — 0.1)л)], 


0.1i+0.1 
Об: =10 | (0.17 + 0.1 — х)2л2 sen rx dx 
0 


sz 


=2л соѕ0.1лі — 20[sen((0.1i + 0.1)л) — sen(0.17ci)]. 


El sistema lineal Ac = b tiene 


2 


aii = 20 + T para cada і = 1, 2,...,9, 
= 
аі = —10 + ©? рага сайа і =1,2,...,8, 
= 
Gii = =l рага cada і =2,3,...,9, 


60 
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b;=40sen(0.1ri)[1 —cos0.17], рага cada i = 1, 2,...,9. 


La solución рага el sistema lineal tridiagonal es 
су = 0.3102866742, cg = 0.5902003271, су = 0.8123410598, 
св = 0.9549641893, cs = 1.004108771, сл = 0.9549641893, 
сз = 0.8123410598, c2 = 0.5902003271, с = 0.3102866742. 


Га aproximación lineal por tramos es 


у la solución real para el problema de valor en la frontera es у(х) = sen xx. La tabla 11.7 


9 


фо) = Y cigi), 


¡=1 


incluye el error en la aproximación en х;, para cada i =1,...,9. 
i Xi (xi) yx) |фОх) — y Gx)! 
1 0.1 0.3102866742 0.3090169943 0.00127 
2 0.2 0.5902003271 0.5877852522 0.00241 
3 03 0.8123410598 0.8090169943 0.00332 
4 0.4 0.9549641896 0.9510565162 0.00390 
5 0.5 1.0041087710 1.0000000000 0.00411 
6 0.6 0.9549641893 0.9510565162 0.00390 
7 0.7 0.8123410598 0.8090169943 0.00332 
8 0.8 0.5902003271 0.5877852522 0.00241 
9 0.9 0.3102866742 0.3090169943 0.00127 


Se puede mostrar que la matriz tridiagonal А provista por las funciones base lineales 
por tramos es definida positiva (consulte el ejercicio 15), por lo que, por el teorema 6.26 en 
la página 311, el sistema lineal es estable respecto al error de redondeo. De acuerdo con la 
hipótesis presentada al inicio de esta sección, tenemos 


|ф(х) — yx) = O(h’), para cada x en [0, 1]. 


Una prueba de este resultado se puede encontrar en [Schul], p. 103-104. 


Base B spline 


El uso de las funciones base lineales por tramos resulta en una solución aproximada para las 
ecuaciones (11.22) y (11.23) que es continua, pero no diferenciable en [0, 1]. Se requiere un 
conjunto más sofisticado de funciones base C? [0, 1] para construir una aproximación. Estas 
funciones base son similares a los splines cúbicos interpolantes analizados en la sección 3.5. 

Recuerde que el spline cúbico interpolante S en los cinco nodos хо, x1, х2, хз у ха para 
una función f está definido por: 


a) S(x) es un polinomio cúbico, que se denota S;(x), en el subintervalo [x;, х1] 
para cada j = 0, 1,2, 3, 4; 


b) Sja; = Р(х) y 5; (у) = бху) para cada j = 0, 1, 2; 
с) Sjaj) = 5; (1) рага cada j = 0, 1, 2; (implicado por (b).) 
d) Si jr) = 501) para cada j = 0,1,2; 


En 1946, I. J. Schoenberg [Scho] 
presentó los B-(para “base”), 
pero por más de una década 
fueron difíciles de calcular. 

En 1972 Carl de Boor (1937-) 
[Deb1] describió las fórmulas 
para la evaluación que mejoraron 
su estabilidad y utilidad. 


Figura 11.5 
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e) 57 1 (1) = 5701) рага cada j = 0, 1, 2; 


f) бе debe satisfacer uno de los siguientes conjuntos de condiciones de frontera: 


) 5" (х0) = S" Œn) =0 
Ш) 5(х0) = / (х0) у (хл) = (хь) (frontera fijada). 


Puesto que la singularidad de la solución requiere que el número de constantes en а), 16, 
sea igual al número de condiciones en b) a través de f), sólo se puede especificar una de las 
condiciones de frontera en f) para los splines cúbicos interpolantes. 

Las funciones de spline cúbico que usaremos para nuestras funciones base reciben el 
nombre de B-splines o splines con forma de campana. Estos difieren de los splines interpo- 
lantes en que se satisfacen ambos conjuntos de condiciones de frontera en (f). Esto requiere 
que las dos condiciones en b) a e) se flexibilicen. Puesto que el spline debe tener dos deri- 
vadas continuas en [хо, ха], borramos dos de las condiciones de interpolación a partir de la 
descripción de los splines interpolantes. En especial, modificamos la condición b) por 


(frontera natural (o libre)) 


b. 5(х;) = Р(х) pataj = 0, 2,4. 


Por ejemplo, el B-spline básico S que se define a continuación y que se muestra en la 
figura 11.5 usa los nodos igualmente espaciados хо = —2, ху = —1, о = 0, x3 = l y 
x4 = 2. Satisface las condiciones interpolantes 

b.  S(x0) =0, 


S(x2) =1, S(x4)=0 


así como ambos conjuntos de condiciones 


) S'o) = 5"(04) =0 у 


ii) S' (хо) = S' (x4) =0. 


0, si x<-—2, 
10+ х), si =2<x<-=1, 
St) = Карл si =1<х «0, en 
1[0- х) –4(1-х)], si O<x<l, 
10 – х)?, si 1<х 52, 
0 si 2<x. 


Ahora usaremos el B-spline básico para construir las funciones base ф; en С2[0, 1]. 
Primero dividimos [0, 1] al seleccionar un entero positivo n y definir л = 1/(n + 1). Esto 
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produce nodos igualmente espaciados x; = ih, para cada i = 0, 1,... ,n + 1. Ahora defi- 


nimos las funciones base ty como 


ф(х) = 9 S 


х = (n+2)h 


al 


h : 


A) 


h 


4$ (EA, 


si 2<i<n-—1l, 


si і= п +1. 


No es difícil mostrar que CAVAN es un conjunto linealmente independiente de splines cúbi- 


cos que satisfacen ġ; (0) = ф;(1) = 0, para cada i = 0, 1,... 


> 


n,n +1 (consulte el ejer- 


cicio 14). Las gráficas de ф;, рага 2 < i < n — 1, se muestran en la figura 11.6 y las gráficas 
de фо, фі, фп, Y Pn+1 están en la figura 11.7. 


Figura 11.6 


y = ф(х) cuando і = 2,...,п = 1 


Puesto que ф;(х) y ф;(х) son diferentes de cero sólo para x € [x;_2, X;+2], la matriz en 
la aproximación Rayleigh Ritz es una matriz de banda con ancho de banda máximo de siete: 


aoo ао\ ао? аоз О КОЛГЕ RRE 0 

do ап ар аз 414 

020 021 a22 023 024 a25 

азо, asi 432, 433, азд. 435, a36, | ten A 

ina 
= An—1,n+1 
С f ч, ап,п+1 
Окоева анаа О) я 2 уя 1` йр» Masa 
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Figura 11.7 


у= Фіх) 


у= ф(х) 


donde 
1 
а} = / POPE (х) + а(х)ф:(х)фу(х)} dx, 
0 
рага cada і, j = 0, 1,... ,n + 1. El vector b tiene las entradas 
1 
ы = / у б)ф:бх)ах. 
0 


La matriz A es definida positiva (consulte el ejercicio 16), por lo que el sistema lineal Ac = b 
se puede resolver mediante el algoritmo de Cholesky 6.6 o la eliminación gaussiana. El al- 
goritmo 11.6 describe detalladamente la construcción de la aproximación del spline cúbico 
ф(х) mediante el método de Rayleigh-Ritz para los problemas de valor en la frontera (11.21) 
y (11.22) enunciados al principio de esta sección. 


Método Rayleigh-Ritz de spline cúbico 
Para aproximar la solución del problema de valor en la frontera 
d dy 
=== (р(х) | +а()у = f(x), рага0 <x < 1, сопу(0) =0 y y(1) =0 
dx dx 
con la suma de splines cúbicos 


n+1 


p =D cipia): 
i=0 


ENTRADA entero n > 1. 


SALIDA coeficientes Co, ... , Cn+1- 


538 CAPÍTULO 11 = Problemas de valor en la frontera para ecuaciones diferenciales ordinarias 


y y y Paso 1 Determine h = 1/(n+ 1). 
4 І 
Y \ 


| Paso 2 Parai=0,...,n+l establezca x; = ih. 
N Determine x-2 = ху = 0; Xn42 = Xn43 = 1. 
Paso З Defina la función 5 mediante 
0, x < —2, 
10+ х)?, —2<х<—1, 
sas 1[0+ х) –41+х)], —1<x<0, 

1[0- х) – 4(1-х)], O<x<l, 
102 x), 1<х<2, 
0, DER 


Paso 4 Defina la base del spline cúbico {ф;} +1 mediante 


1=0 
х x+h 
мо 5 (5) as ( М ) 
— һ 
mo 5 (5 os (E |: 
gws (279 


E X—=Xn\ _ x—(n+2)h 
TE е = 


mato = s (55) -as (ED 


| pmi =2,...,л-1, 


h h 


Paso 5 Parai = 0,... ‚п + 1 haga los pasos 6—9. 
(Nota: Las integrales en los pasos 6 y 9 se pueden evaluar usando un 
procedimiento de integración numérica.) 


Paso 6 Рага ј = і, і + 1,... ,mín{i +3,n +1} 
determine L = тах{ху—2,0}; 
U = mín(x;+2, 1); 
ау = ЈЕ [POED +4(00:000,(0)] ах; 
sii Æ j, епёопсеѕ determine aj; = а:;. (Puesto que A es simétrica.) 
Paso 7 Sii > 4 entonces para j = 0, ... ‚7 — 4 determine а;; = 0. 
Paso 8 Sii<n-—3 entonces para j = i + 4,...,п + 1 determine а;; = 0. 
Paso 9 Determine L = máx(x;-2, 0}; 
U = mín{x;42, 1); 
bi = f; /@)ф(х) dx. 
Paso 10 Resolver el sistema lineal Ac = b, donde А = (а), b = (bp,... , bn41) y 
c= (Co, 192-9 Саат). 


Paso 11 Parai = 0,...,п +1 
SALIDA (c;). 


Paso 12 PARE. (El procedimiento está completo.) ш 


Ilustración 


Tabla 11.8 


Boris Grigorievich Galerkin 
(1871-1945) realizó trabajos 
fundamentales al aplicar las 
técnicas de aproximación para 
resolver problemas de valor 

en la frontera relacionados con 
problemas de ingeniería civil. Su 
artículo inicial sobre análisis de 
elementos finitos fue publicado 
en 1915 y su manuscrito 
fundamental sobre placas 
elásticas delgadas en 1937. 
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Considere el problema de valor en la frontera 
—y"+1?y = 2л? ѕеп(лх), рага0 < x < 1, con y(0) = y(1) = 0. 


En la ilustración después del algoritmo 11.5, hacemos h = 0.1 y generamos aproximaciones 
usando funciones base lineales por tramos. La tabla 11.8 muestra los resultados obtenidos al 
aplicar los B-splines como se describe en el algoritmo 11.6 con la misma selección de nodos. 

ш 


Ї Ci Xi Q(x) у(х) уб) — ф(х) 
0 0.50964361 х 1075 0 0.00000000 0.00000000 0.00000000 
1 0.20942608 0.1 0.30901644 0.30901699 0.00000055 
2 0.39835678 0.2 0.58778549 0.58778525 0.00000024 
3 0.54828946 0.3 0.80901687 0.80901699 0.00000012 
4 0.64455358 0.4 0.95105667 0.95105652 0.00000015 
5 0.67772340 0.5 1.00000002 1.00000000 0.00000020 
6 0.64455370 0.6 0.95105713 0.95105652 0.00000061 
7 0.54828951 0.7 0.80901773 0.80901699 0.00000074 
8 0.39835730 0.8 0.58778690 0.58778525 0.00000165 
9 0.20942593 0.9 0.30901810 0.30901699 0.00000111 
10 0.74931285 х 1075 1.0 0.00000000 0.00000000 0.00000000 


Recomendamos que las integraciones en los pasos 6 у 9 se realicen en dos partes. Prime- 
ro, construimos polinomios interpolantes de spline cúbico para р, q y f usando los métodos 
presentados en la sección 3.5. A continuación, aproximamos los integrandos por productos 
de splines cúbicos o derivadas de splines cúbicos. Ahora, los integrandos son polinomios por 
tramos y se pueden integrar exactamente en cada subintervalo y después sumarse. Esto lleva 
a aproximaciones exactas de las integrales. 

Las hipótesis asumidas al principio de esta sección son suficientes para garantizar que 


1 1/2 
{/ убх) = $01? ах} = О(%), si Des El 
0 


Para una comprobación de este resultado, consulte [Schull], р. 107-108. 

Los B-splines también se pueden definir para nodos no espaciados equitativamente, pero 
los detalles son más complicados. Una presentación de la técnica se puede encontrar en 
[Schull], p. 73. Otra base que se usa de manera común es el polinomio de Hermite cúbico por 
tramos. Para una excelente presentación de este método, consulte de nuevo [Schull], p. 24ff. 

Otros métodos que reciben considerable atención son Galerkin o métodos de “forma 
débil”. Para el problema de valor en la frontera que hemos considerado, 


= (pos) +9(х)у = fŒ), рага0 <x < 1, сопу(0) =0 y y(1) = 0, 

ах ах 
bajo las suposiciones lis mencionadas al principio de esta sección, los métodos de 
Galerkin y Rayleigh-Ritz se determinan con la ecuación (11.27). Sin embargo, éste no es el 
caso de un problema de valor en la frontera arbitrario. Un tratamiento sobre las similitudes 
y las diferencias en los dos métodos y un análisis de la amplia aplicación del método de 
Galerkin se puede encontrar en [Schull] y en [SF]. 
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La raíz de la palabra 
“colocación” proviene del 
Latín “co-* y “locus”, lo cual 
indica “junto con” y “lugar”. Es 
equivalente a lo que llamamos 
interpolación. 


Otra técnica popular para resolver problemas de valor en la frontera es el método de 
colocación. 


Este procedimiento comienza seleccionando un conjunto funciones base {фі,... , фу), 
un conjunto de números ([x;, ... , Xn} en [0, 1] y requieren que una aproximación 
N 


X cipia) 


i=1 


satisfaga la ecuación diferencial de cada número xj, рага 1< j < п. Si, además, se re- 
quiere que ф; (0) = ф;(1) = 0, para 1< і < N, entonces las condiciones de frontera se 
satisfacen automáticamente. Se ha prestado mucha atención en la literatura a la selección 
de números (x;) y las funciones base {ф;}. Una selección común es permitir que ф; sea la 
función base para las funciones spline relativas a una partición [0, 1] y que los nodos (x;) 
sean puntos gaussianos o raíces de ciertos polinomios ortogonales, transformados en el su- 
bintervalo adecuado. 

Una comparación de diferentes métodos de colocación y métodos de diferencia finita 
se encuentra en [Ru]. La conclusión es que los métodos de colocación que utilizan splines 
de grado superior compiten con las técnicas de diferencia finita que utilizan extrapolación. 
Otras referencias para métodos de colocación son [DebS] y [LR]. 


La sección Conjunto de ejercicios 11.5 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 11.6 Software numérico 


La biblioteca IMSL tiene muchas subrutinas para problemas de valor en la frontera. Existen 
tanto métodos de disparo como de diferencia finita. Los métodos de disparo usan la técnica 
Runge-Kutta-Verner para resolver los problemas de valor inicial relacionados. 

La biblioteca NAG también tiene una multitud de subrutinas para resolver problemas de 
valor en la frontera. Algunos de estos son un método de disparo que usa el método de valor 
inicial Runge-Kutta-Merson junto con el método de Newton, un método de diferencia finita 
con el de Newton para resolver un sistema lineal y uno de diferencia finita lineal con base 
en la colocación. 

Existen subrutinas en el paquete ODE contenido en la biblioteca Netlib para resolver 
problemas de valor en la frontera de dos puntos no lineales y lineales, respectivamente. Estas 
rutinas están basadas en métodos de múltiples disparos. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


CAPÍTULO 


Soluciones numéricas para ecuaciones 
diferenciales parciales 


Introducción 


Un cuerpo es isotrópico si la conductividad térmica en cada uno de sus puntos es inde- 
pendiente de la dirección del flujo de calor a través del punto. Suponga que k, c y p son 
funciones de (x, y, z) y representan, respectivamente, la conductividad térmica, el calor es- 
pecífico y la densidad de un cuerpo isotrópico en el punto (x, y, z). Entonces la temperatura 
и =u(x, у, 2,1), en el cuerpo se puede encontrar al resolver la ecuación diferencial parcial 


д си ГЕ. p ч. pe КЕР 

Әх Vox) ду\ oy) oa No) “or 
Cuando k, c y p son constantes, a esta ecuación se le conoce como ecuación de calor tridi- 
mensional y se expresa como 


ди Yu ди срди 


а Т dy? 042 Кд 


Si la frontera del cuerpo es relativamente simple, la solución de esta ecuación se puede en- 
contrar por medio de series de Fourier. 

En muchas situaciones, cuando k, c y p no son constantes o cuando la frontera es irre- 
gular, la solución de la ecuación diferencial parcial se debe obtener por medio de técnicas de 
aproximación. En este capítulo se presenta una introducción a estas técnicas. 


Ecuaciones elípticas 


Generalmente las ecuaciones diferenciales parciales se clasifican de manera similar a las 
secciones cónicas. La ecuación diferencial parcial que consideraremos en la sección 12.1 
involucra 4yy(x, y) +4yy(x, y) y es una ecuación elíptica. A la ecuación elíptica particular 
que consideraremos se le conoce como ecuación de Poisson: 


д?и д?и 
90202) + qa y) = f(x, y). 


En esta ecuación, suponemos que f describe la entrada para el problema en una región plana R 
con frontera S. Las ecuaciones de este tipo surgen en el estudio de diferentes problemas físicos 
independientes del tiempo, como la distribución de estado estable del calor en una región 
plana y problemas de estado estable bidimensionales que implican fluidos incompresibles. 
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Siméon-Denis Poisson 
(1781-1840) era un estudiante de 
Laplace y Legendre durante los 
años napoleónicos en Francia. 
Más adelante, asumió la cátedra 
en la École Polytechnique, 
donde trabajó con ecuaciones 
diferenciales parciales y 
ordinarias y, después, en la teoría 
de la probabilidad de la vida. 


Figura 12.1 


Pierre-Simon Laplace 
(1749-1827) trabajó en muchas 
áreas matemáticas, produjo 
artículos fundamentales 

sobre probabilidad y física 
matemática. Publicó su trabajo 
más importante sobre la teoría 
del calor durante el periodo de 
1817-1820. 


Johann Peter Gustav Lejeune 
Dirichlet (1805-1859) hizo 
importantes contribuciones a las 
áreas de la teoría numérica y la 
convergencia de las series. De 
hecho, podría ser considerado 
como el fundador de las series 
de Fourier ya que, de acuerdo 
con Riemann, fue el primero en 
escribir un artículo profundo 
sobre este tema. 


Figura 12.2 


= Soluciones numéricas para ecuaciones diferenciales parciales 


Deben imponerse restricciones adicionales para obtener una solución única para la ecua- 
ción de Poisson. Por ejemplo, el estudio de la distribución de estado estable de calor en una 
región plana requiere que f (x, у) = 0, lo cual resulta en una simplificación para la ecuación 
de Laplace 


Si la temperatura dentro de la región se determina mediante la distribución de tempe- 
ratura en la frontera de la región, las restricciones reciben el nombre de condiciones de 
frontera de Dirichlet, dadas por 


u(x, у) = g(x, y), 


para todas las (x, y) en S, la frontera de la región R. (Consulte la figura 12.1.) 


(x, y): La temperatura se 
mantiene constante 


en g(x, y) grados 


„> 
Xx 


Ecuaciones parabólicas 


En la sección 12.2 consideramos la solución numérica del problema que involucra una ecua- 
ción diferencial parcial parabólica de la forma 


д?и 
2 
а 552 (x,t) = 0. 


Ве j 
qe 


El problema físico considerado aquí aborda el flujo de calor a lo largo de una varilla (o barra) 
de longitud / (consulte la figura 12.2) que tiene una temperatura uniforme en cada sección 
transversal. Esto requiere que la varilla esté perfectamente aislada en su superficie lateral. Se 
supone que la constante о es independiente de la posición en la varilla. Se determina median- 
te las propiedades conductoras de calor del material del que ésta se compone 


Uno de los conjuntos comunes de las restricciones para un problema de flujo de calor de 
este tipo es especificar la distribución inicial de calor en la varilla, 


u(x,0) = f(x), 


Figura 12.3 
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y describir la conducta en sus extremos. Por ejemplo, si los extremos se mantienen a tempe- 
raturas constantes U; y Uz, las condiciones en la frontera tienen la forma 


u(0,t)=U1 y u(,t)=U», 
y la distribución de calor se aproxima a la distribución límite de temperatura 


U2 — О 
-= 


lím u(x,t) = Ui + 
t>00 l 


Si, por el contrario, la varilla se aísla de tal forma que el calor no fluye a través de los extre- 
mos, las condiciones en la frontera son 


ди A= Ya y=0 
ax y д" 


Entonces, el calor no escapa de la varilla у, еп el caso límite, la temperatura en la varilla es 
constante. La ecuación diferencial parcial parabólica también es importante en el estudio de 
la difusión de gas; de hecho, es conocida en algunos círculos como ecuación de difusión. 


Ecuaciones hiperbólicas 


El problema estudiado en la sección 12.3 es la ecuación de onda y es un ejemplo de una 
ecuación diferencial parcial hiperbólica. Suponga una cuerda elástica de longitud / se estira 
entre dos soportes en el mismo nivel horizontal (consulte la figura 12.3). 


+ > + 
x, tiempo fijo t 


Si la cuerda se configura para vibrar en un plano vertical, el desplazamiento vertical u (x, t) 
de un punto x en el tiempo 7 satisface la ecuación diferencial parcial 


¿Yun 1) Е пе 0 І O<t 

а —(x,t) = —(x,t) =0, ara0 < x < <t, 

dx? дї? E и 

siempre y cuando se ignoren los efectos de amortiguamiento y la amplitud no sea tan gran- 
de. Para imponer restricciones sobre este problema, suponemos que la posición inicial y la 
velocidad de la cuerda están dadas por 


и(х,0) = f(x) y ,0)=8(0, para0 < х <l. 


Si los extremos están fijos, también tenemos u(0, t) = 0 y u(l, t) = 0. 

Otros problemas físicos implican la presencia de la ecuación diferencial parcial 
hiperbólica en el estudio de vigas que vibran con uno o ambos extremos sujetados y en la 
transmisión de electricidad en una línea larga donde existe alguna fuga de corriente hacia 
el piso. 
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12.1 Ecuaciones diferenciales parciales elípticas 


Figura 12.4 


La ecuación diferencial parcial elíptica que consideramos es la ecuación de Poisson, 


Vu j ү )= /(х,у) 
и(х, у) = 00 ау2 2) = 76,0), (12.1) 


еп R = {(х,у)|а <х < Ь,с < y < а}, сопи(х, у) = g(x, y) рага(х, y) є S, donde 5 
denota la frontera de R. Si f y g son continuas en sus dominios, entonces existe una única 
solución para esta ecuación. 


Selección de una cuadrícula 


El método utilizado es una adaptación bidimensional del método de diferencias finitas para 
problemas lineales de valor en la frontera, analizados en la sección 11.3. El primer paso es 
seleccionar enteros n y т para definir los tamaños de paso Л = (b — a)/n y k = (d — c)/m. 
La división del intervalo [a, b] en n partes iguales, de ancho л y el intervalo [c, d] еп m partes 
iguales, de ancho k (consulte la figura 12.4). 


Coloque una cuadrícula sobre el rectángulo R al trazar líneas verticales y horizontales a 
través de los puntos con coordenadas (x;, уу), donde 


x¡=a+ih, paracadai=0,1,...,n, у у; =с+јК, paracada¡=0,1,...,m. 


Las líneas x = x; y y = у; son líneas de cuadrícula y sus intersecciones son los puntos de 
malla de la cuadrícula. Para cada punto de malla en el interior de la cuadrícula (ху, yj), para 
i¡=1,2,..., n= 1уј = 1,2,..., т – 1, podemos usar la serie de Taylor en la variable x 
alrededor de x; para generar la fórmula de diferencias centradas 


2 


ls их, Yj) — 2U (xi, уу) Hui yj) А2 atu 
gai Y = 


h? 12 дх* 


(is yj), (12.2) 


donde &; € (х;—1, Xi+1). También podemos usar la serie de Taylor en la variable y alrededor 
de y; рага generar la fórmula de diferencias centradas 


2 


ди и(х;, уул) — 2u (xi, уу) ибх, yj-1) k? atu 
ya yj) = 


k? 12 9у* 


бәл), (12.3) 


donde 1); € (уу-1, Y j+1). 


Figura 12.5 
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Por medio de estas fórmulas en la ecuación (12.1) podemos expresar la ecuación de 
Poisson en los puntos (x;, yj) como 


U(Xig1, Уу) = ZU (Xi, уу) + U(Xi1, уу) m U(Xi, ур) = 2u (Xi, уу) + U(Xi, yj-1) 


h2 02 
Mea ТЕ Е 
= J (Xi, уу БУУ = 2100,0), 
VHE a E рН 
рага сайа і = 1, 2,...,п = 1уј = 1,2,..., т — 1. Гаѕ condiciones de frontera son 
и(хо, уу) = &(х0, Yj) Y Un) уу) = 8(Xn, уу), раасайа j = 0, 1,..., т; 


и(хг, уо) = 8i: Yo) Y и(х, уһ) = 8(%;, ут), para cada i = 1,2,...,п – 1. 
Método de diferencias finitas 


En la forma de ecuación de diferencia, esto resulta en el método de diferencias finitas: 


h\? nv? 
(2) + 1 = (ир, + Wi) = 8 (игу FW; 1) = =h? f (xi, yj), 
(12.4) 
para cada i = 1,2,...,n— 1уј = 1,2,...,т – 1,у 
woj = 8(х0, 33) У Wn¡=2(Xp, уу), рагасайа j = 0, 1,...,т; (12.5) 
wio = (0, уо) Y Wim = 8(Xi, Ym), рагасайа i = 1, 2,...,п — l; 


donde w; ; aproxima u(x;, yj). Este método tiene error de truncamiento local de orden ok? 
+1). 
La ecuación común en (12.4) implica aproximaciones para u(x, y) en los puntos 


Gits б, у), Groty) бул). У буна 


Reproducir la parte de la cuadrícula en la que se localizan estos puntos (consulte la figu- 
ra 12.5) muestra que cada ecuación implica aproximaciones en la región en forma de estrella 
alrededor de la x en (x;, y;). 


Usamos la información a partir de las condiciones de frontera (12.5) siempre que 
sea apropiado en el sistema dado por la ecuación (12.4), es decir, en todos los pun- 


546 


CAPÍTULO 12 = Soluciones numéricas para ecuaciones diferenciales parciales 


Figura 12.6 


Ejemplo 1 


tos (x; уу) adyacentes a un punto de malla en la frontera. Esto produce un sistema lineal 
(п — 1)(m— 1) х (n— 1)(n — 1) con las incógnitas como aproximaciones w; ; рага u(x;, уу) 
en los puntos de malla interiores. 

El sistema lineal que contiene estas incógnitas se expresa, para los cálculos de matriz, 
de forma más eficiente si se introduce el reetiquetado de los puntos de malla interiores. Un 
etiquetado recomendado de estos puntos (consulte [Var1], p. 210) es hacer 


Р = (х,у) Y W= Wij 


donde / = і + (m — 1 — ])(п — 1), para cadai=1,2,...,n=1yj=1,2,...,m- 1. 
Esto etiqueta los puntos de malla de forma consecutiva desde la izquierda hasta la derecha 
y desde la parte superior hasta la parte inferior. Etiquetar los puntos de esta forma garantiza 
que el sistema necesario para determinar w; ; es una matriz con un ancho de banda como 
máximo 2n — 1. 


Por ejemplo, con n = 4 y m = 5, el reetiquetado resulta en una cuadrícula cuyos puntos 
se muestran en la figura 12.6. 


Determine la distribución de calor en estado estable en una placa de metal cuadrada y del- 
gada con dimensiones de 0.5 m por 0.5 m usando п = т = 4. Dos fronteras adyacentes se 
mantienen a 0°С y el calor en las otras fronteras se incrementa de manera lineal desde 0°С en 
una esquina hasta 100°C donde se unen los lados. 


Solución Coloque los lados con las condiciones de frontera cero a lo largo de los ejes x y y. 
Entonces, el problema se expresa como 
2 2 


ди Е ди 
эз О) + 95260 У) = 0, 


рага (х, у) en el conjunto R = { (х, у) [0 < х < 0.5, 0 < у < 0.5}. Las condiciones de 
frontera son 


и(0, y)=0, и(х,0) = 0, и(х, 0.5) = 200x, y u(0.5, у) = 200y. 


Sin = т = 4, el problema tiene la cuadrícula que se muestra en la figura 12.7 y la ecuación 
de diferencias (12.4) es 


4w; j Wi+1, ~ Wiig Е, j-1 Wi, j+1 = 0, 


рага cada i = 1,2,3 y j = 1,2,3. 


Tabla 12.1 


о со с їл Б шо цо н 


Wi 
18.75 
37.50 
56.25 
12.50 
25.00 
37.50 

625 
12.50 


18.75 
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Figura 12.7 


u(x, 0.5) = 200x 


P, 


и(0, y) = 0 u(0.5, y) = 200y 


Expresar esto en términos de puntos de cuadrícula interior reetiquetados w; = u(P;) 
implica que las ecuaciones en los puntos P; son 


Pi: 4w; = w2 — W4 = оз + W1,4, 
Р: Дуро — w3 — W1 — W5 = W24, 

P; : 4w3 — W2 — W6 = W4,3 + W3,4, 
Pa: 4w4 — W5 — W1 — W7 =W0.2, 

Ps y 4ws W6 Wa Wa Wg = 0, 

Ро : 4w6 — W5 — W3 — W9 = W4.2, 

Рз : 4w7 — wg — w4 = Wo,1 + 1,0, 
Pg: Awg — w9 — w7 — W5 = W20, 

Р»: Дуро — Wg — W6 = W3, + W4,1, 


donde los lados derechos de las ecuaciones se obtienen a partir de las condiciones de fron- 
tera. 
De hecho, las condiciones de frontera implican que 


Ито = 020 = W30 = М0, = Ил = Wo = 0, 


иза =W41 =25, мәд = №42 = 50, y w34 = W43 = 75. 


Por Іо que el sistema lineal asociado con este problema tiene la forma 


4 —1 0 —1 0 0 0 0 0 wi 25 
—1 4 —1 0 —1 0 0 0 0 w2 50 
0 —1 4 0 0 —1 0 0 0 уз 150 
—1 0 0 4 —1 0 —1 0 0 W4 0 
0 —1 0 —1 4 —1 0 —1 0 ws | = 0 
0 0 —1 0 —1 4 0 0 —1 w6 50 
0 0 0 —1 0 0 4 —1 0 w7 0 
0 0 0 0 —1 0 —1 4 —1 wg 0 
0 (0) 0 0 0 —1 0 —1 4 Wo 25 
Los valores de w;, w2, . . . , мо, encontrados al aplicar el método Gauss-Seidel a esta matriz 


se establecen en la tabla 12.1. 
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Estas respuestas son exactas porque la verdadera solución, u(x, y) = 400xy, tiene 


du u _ б 
dat ду 
y el error de truncamiento es cero en cada paso. ш 


El problema considerado en el ejemplo 1 tiene el mismo tamaño de malla, 0.125, en 
cada eje y requiere resolver solamente un sistema lineal 9 X 9. Esto simplifica la situación 
y no introduce los problemas computacionales presentes cuando el sistema es más grande. 
El algoritmo 12.1 usa el método iterativo de Gauss-Seidel para resolver el sistema lineal que 
resulta y permite tamaños de malla desiguales en los ejes. 


Diferencia finita de la ecuación de Poisson 


Para aproximar la solución de la ecuación de Poisson 
uu %u 
23M.) + (0,у) = Р(х,у), а<х<Ь, csy<d, 
dx? dy? 

sujeta a las condiciones de frontera 


u(x, y) =8(%,y) six=a0x=b y c<y<d 


u(x, y) =8(x,y) siy=coy=d y a<x<b: 


ENTRADA extremos а, b, с, 2; enteros т > 3, п > 3; tolerancia ТОГ; número máximo 
de iteraciones N. 


SALIDA aproximaciones w; ; para u(x;, y;) para сайа і = 1,...,n—1 ara cada 
LJ 1 J 
j=1,...,m-— 1 o un mensaje que indica que se excedió el número máximo de iteraciones. 


Paso 1 Determine Л = (b — a)/n; 


к= (d – с)/т. 

Paso 2 Parai = 1,... ‚п — 1 determine x; = а + ih. (Los pasos 2 y 3 construyen 
puntos de malla.) 
Paso 3 Рага j = 1,..., т — 1 determine yj = c + jk. 
Paso 4 Parai=1,...,n—1 
paraj = 1,...,т — 1 determine у; ; = 0. 

Paso 5 Determine à = h?/k?; 

ш = 2(1+ А); 

1= 1. 


Paso 6 Mientras l < N haga los pasos 7-20. (Los pasos 7-20 realizan iteraciones de 
Gauss-Seidel.) 
Paso 7 Determine z = (А2 f (х1, Ym-1) + 8(4, Ym-1) + А8 (х1, 0) 
+ AW1m-2 + W2,m-1)/ H; 
NORM = |z — w1,m-1l; 
Wim-1 =Z. 


Paso 8 Parai =2,...,n— 2 
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determine z = (—h?f (Xi, Ym-1) + Ag Xi, d) + Wi-1,m-1 

+Wi+1,m-1 + AWim-2) / 14; 
si |w;m-1 — Z| > NORM entonces establezca NORM = |у, m-1 — Z|; 
determine Wi m-1 = Z. 


Paso 9 Determine z = (—Л? /(х„—1, Ym-1) + 8(b, Ym-1) + Ag (х—1, d) 
+» 2,т—1 ++ м, 1,т 2)/4; 
si |W»-1.m-1 — Z| > NORM entonces determine NORM = |wn-1,m-1 = z|; 
determine W»-1.m-1 = 2. 


Paso 10 Para j =m — 2,... ,2 haga los pasos 11,12, y 13. 


Paso 11 Determine z = (—h?f(x1, уу) + g(a, уу) Аи р 
ФА ¡1 + w2, з) 5 
si [иу = z| > NORM entonces determine NORM = |у, — z|; 
determine уу = 2. 


Paso 12 Parai = 2,...,п – 2 
determine z = (—h? f (xi, уу) + Wi, 5 + ÀW; р 
Фит, у EA Wi j-1)/4; 
si |w; у — z| > NORM entonces determine NORM = |w; j — 2]; 
determine w; = 2. 


Paso 13 Determine z = (~h? f (xp-1, уу) + 2 (b, уу) +Wn-2,j 
+ÀWn-1,j+1 + Аиа, 1)/13 
si |0,1, — z| > NORM entonces determine NORM = |„—1,у — 2]; 
determine w,-1,¡=Z. 


Paso 14 Determine z = (—h? f (x1, y1) + g(a, y1) + Ag(x1,0) +4w12 + w2,1)/4; 
si [и — z| > NORM entonces determine NORM = | 1 — 2]; 
determine у = Z. 


Paso 15 Parai =2,...,n—2 
determine z = (—h? f (xi, y1) + Ав (лт, с) + Wi-11 + Àw; 2 + Wi+1,1)/4; 
si |w; = z| > NORM entonces determine NORM = |w; 1 — z|; 
determine w; = Z. 


Paso 16 Determine z = (—h? f (xn-1, у) + g (b, уу) + Ag (Xn-1, ©) 
+Wn-2,1 + ÀWn-1,2)/4; 
si |w»-1.1 — z| > NORM entonces determine NORM = |wn-1,1 — zl; 
determine W»-1.1 = 2. 


Paso 17 Si NORM < TOL entonces hacer los pasos 18 y 19. 


Paso 18 Рага і = 1,...,п – 1 
paraj = 1,...,т — 1 SALIDA (x;, уу, мг 7). 


Paso 19 PARE. (El procedimiento fue exitoso.) 
Paso 20 Determine / =/+1. 


Paso 21 SALIDA (“Número máximo de iteracciones excedido”); 
(El procedimiento no fue exitoso.) 
PARE. п 


A pesar de que el procedimiento iterativo de Gauss-Seidel se incorpora en el algoritmo 
12.1 para simplicidad, es aconsejable usar una técnica directa como eliminación gaussiana 
cuando el sistema es pequeño, del orden de 100 o menos, porque el carácter definida positiva 
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garantiza estabilidad respecto a errores de redondeo. Especialmente, una generalización del 
algoritmo de factorización de Crout 6.7 (consulte [Var1], р. 221) es eficiente para resolver 
este sistema porque la matriz es de la forma tridiagonal simétrica por bloques 


Ay Су 0 ненае 0 
Ci A, © 

б. б : 

; Pa a 

0 Ее с 0. Cr- 1 de 


con bloques cuadrados de tamaño (и — 1) X (и — 1). 


Selección del método iterativo 


Para sistemas grandes se debería usar un método iterativo, específicamente, el método SOR 
analizado en el algoritmo 7.3. La selección de w que es óptima en esta situación proviene 
del hecho de que cuando A se descompone en su diagonal D y partes triangular superior y 
triangular inferior U y L, 


А= р- 1-0, 
у В es la matriz рага el método de Jacobi, 
B=D"(L+0), 


entonces, el radio espectral de B es (consulte [Varl ]) 


| 


El valor de w que se va a usar es, por consiguiente, 


PRE nor Ка em 
= feos ( )+ cos | — 
п 


Una técnica de bloque se puede incorporar al algoritmo para convergencia más rápida del 
procedimiento SOR. Para una presentación de esta técnica, consulte [Var1], p. 219-223. 


Ejemplo 2 Use el método de diferencias finitas de Poisson con n = 6,m = 5, y una tolerancia de 107 
para aproximar la solución de 


д2и д2и Я 
гаас оре О <х<2, 0 <у=< 1, 


con las condiciones de frontera 


u(0,y)=0, 1uQ,y)=2e", O<y<l, 


и(х,0) = х, u(x,l)=ex, 0 <х < 2, 


y compare los resultados con la solución exacta u(x, у) = xe”. 


Tabla 12.2 
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Solución Usando el algoritmo 12.1 con un número máximo de iteraciones establecidas en 
N = 100 proporciona los resultados en la tabla 12.2. El criterio de detener el método Gauss— 
Seidel en el paso 17 requiere que 


„(0 – wE” 10, 


рага cadai=1,...,5yj=1,...,4. La solución de la ecuación de diferencias se obtuvo 
con exactitud y el procedimiento se detuvo en / = 61. Los resultados, junto con los valores 
correctos, se presentan en la tabla 12.2. п 
1 Ј Xi У; wE u(x, yj) U(X;, уу) = №09) 

1 1 0.3333 0.2000 0.40726 0.40713 1.30 х 107* 

1 2 0.3333 0.4000 0.49748 0.49727 2.08 х 107* 

1 3 0.3333 0.6000 0.60760 0.60737 2.23 x 1074 

1 4 0.3333 0.8000 0.74201 0.74185 1.60 x 1074 

2 1 0.6667 0.2000 0.81452 0.81427 2.55 x 1074 

2 2 0.6667 0.4000 0.99496 0.99455 4.08 х 1074 

2 3 0.6667 0.6000 1.2152 1.2147 4.37 х 1074 

2 4 0.6667 0.8000 1.4840 1.4837 3.15 x 1074 

3 1 1.0000 0.2000 1:2218 1.2214 3.64 x 107* 

3 2 1.0000 0.4000 1.4924 1.4918 5.80 x 1074 

3 3 1.0000 0.6000 1.8227 1.8221 6.24 x 107* 

3 4 1.0000 0.8000 2.2260 2.2255 4.51 x 1074 

4 1 1.3333 0.2000 1.6290 1.6285 4.27 x 10? 

4 2 1.3333 0.4000 1.9898 1.9891 6.79 x 107* 

4 3 1:3333 0.6000 2.4302 2.4295 7.35 х 107* 

4 4 1.3333 0.8000 2.9679 2.9674 5.40 х 107* 

5 1 1.6667 0.2000 2.0360 2.0357 3.71 х 1074 

5 2 1.6667 0.4000 2.4870 2.4864 5.84 х 107* 

2 3 1.6667 0.6000 3.0375 3.0369 6.41 x 107* 

5 4 1.6667 0.8000 3.7097 3.7092 4.89 x 1074 


La sección Conjunto de ejercicios 12.1 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Ecuaciones diferenciales parciales parabólicas 


La ecuación diferencial parcial parabólica que consideramos es la ecuación de calor, o di- 
fusión 
du д? 


эү) = о (0, O<x<l, t>0, (12.6) 
Ж 


sujeta a las condiciones 


u(0,t)=u(1,1t)=0, t>0, y u(x,0)=f(x) O<x<l. 


El enfoque que usamos para aproximar la solución de este problema implica diferencias 
finitas y es similar al método que se usó en la sección 12.1. 

En primer lugar, seleccione un entero т > 0 y defina el tamaño de longitud de paso del 
ejexh = l/m. A continuación, seleccione un tamaño de longitud de paso de tiempo k. Los 
puntos de cuadrícula para esta situación son (ху, 1;), donde x; = ih, para i = 0, 1,..., m, y 
13 = ЈК, рагај = 0, 1,.... 
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Método de diferencias progresivas 


Nosotros obtenemos el método de diferencias mediante la serie de Taylor en t para formar el 
cociente de diferencias 
e u(x t; + К) —u(x;,t;) к д?и 
дї k 2 ðt? 


(Xi, Uj), (12.7) 


para alguna и € (tj, tj+1), y la serie de Taylor en x para formar el cociente de diferencias 


д?и и(х + А, 5) = 2и( ti) + u(x; —h,t;) h? ðtu 
= (Mi, tj) = 
dx? h? 12 dx? 


(Et), (12.8) 


donde ё; € (X;_1, Xi+1). 


La ecuación diferencial parcial parabólica (12.6) implica que para los puntos en el inte- 
rior de la malla (ху, tj), para cadai=1,2,...,m=1yj=1,2,..., tenemos 


д 
д 


и ¿Lu 
r&i tj) а gait) =0, 


así que el método usa los cocientes de diferencias (12.7) y (12.8) es 


Wijt = Wi AE 2013 + М1, 


z a =0, (12.9) 


donde у; ; aproxima a u(x;, tj) 
El error de truncamiento local para esta ecuación de diferencias es 


k д?и h? д%и 


— O. А — 2 = ант Н $ 
чу = уа б и) 0 (Ent). (12.10) 


Resolviendo la ecuación (12.9) para у; j+; obtenemos 
20 k 2k 
wija = {1 p wij +a үз Wj + wi-1,j), (12.11) 


para cada i = 1,2,...,m — 1y ј = 1, 2,.... 
Así, obtenemos 
wo, = f (xo), wio = f@1), ...Wmo= f (tm). 


Luego generamos la siguiente t-fila por 


иол =u (0, f1) = 0; 


h2 


20°к ‚К 
мт = {1 — wio +g zz 020 + wo,0); 


2œ?k ‚К 
м2 = {1 — w20 +Q gz 30 + 071,0); 


h2 


2a?k a k | 
Wm-1,1 = = Ea Wm-1,0 F Q gz Wmo + Wm-2,0); 


Wm,1 =u (m, ti) =0. 
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Ahora podemos usar los valores у; | para generar todos los valores de la forma у; 2. 
La naturaleza explícita del método de diferencias implica que la matriz (m — 1) x (m — 1) 
asociada con este sistema puede escribirse en forma tridiagonal 


(1-21) A Ое 0 
о ПЕ да л 
ПИЕ о А (1—2) 


donde A = 0? (k/h2). Si hacemos 


wo = (fœ, ЈО), sreg ТС) 


wo = (wij, Wajr...> Wm-1,;j)' para cada j Е 1.25 bway 
entonces, la solución aproximada está dada por 
у) = Ам), рагасайај = 1,2,..., 
por lo que зу? se obtiene a partir de мж!) mediante una simple multiplicación de matriz. 
A esto se le conoce como el método de diferencias progresivas y la aproximación en el 
punto azul mostrado en la figura 12.8 usa información de otros puntos marcados en esa figu- 


ra. Si la solución de la ecuación diferencial parcial tiene cuatro derivadas parciales en x y dos 
en т, entonces la ecuación (12.10) implica que el método es de orden O(k + 0). 


Еідига 12.8 


о 
о 
о Método de 
o diferencia 
O progresiva 


о 


Ejemplo 1 Use los tamaños de paso a) л = 0.1 y k = 0.0005 y b) h = 0.1 y k = 0.01 para aproximar la 
solución de la ecuación de calor 
du %u 
gD 000, О<х<1, O<t, 


con condiciones de frontera 


u(0,t) =u(1,t)=0, 0 <, 
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y condiciones iniciales 


и(х,0) = ѕеп(лх), O<x<l. 


Compare los resultados en £ = 0.5 con la solución exacta 


л 


2 
u(x,t) = е 7 'зеп(лх). 


Solución а) El método de diferencias progresivas соп Л = 01,К = 0.0005, y A = 
(1)2(0 .0005/ (0.1?) = 0.05 da los resultados en la tercera columna de la tabla 12.3. Como se 
puede observar a partir de la cuarta columna, estos resultados son bastante exactos. 

b) El método de diferencias progresivas conh = 0.1,k = 0.01 yA = (1)2(0 01/0.1)?) =1 
da los resultados en la quinta columna de la tabla 12.3. Como se puede observar a partir de 


la sexta columna, estos resultados son inútiles. ш 

Tabla 12.3 
W;,1000 Wi,50 

xi u(x;, 0.5) k = 0.0005 Ju (xi, 0.5) — wi 1000] k = 0.01 Ju (x;, 0.5) — и: зо] 
0.0 0 0 0 
0.1 0.00222241 0.00228652 6.411 х 1055 8.19876 х 10” 8.199 х 10” 
0.2 0.00422728 0.00434922 1.219 х 1074 — 1.55719 х 10% 1.557 х 10% 
0.3 0.0058 1836 0.00598619 1.678 х 10-* 2.13833 х 108 2.138 х 108 
0.4 0.00683989 0.00703719 1.973 х 1074 —2.50642 х 10% 2.506 х 10% 
0.5 0.00719188 0.00739934 2.075 х 1074 2.62685 х 10% 2.627 х 108 
0.6 0.00683989 0.00703719 1.973 х 10-* —2.49015 х 108 2.490 х 108 
0.7 0.0058 1836 0.00598619 1.678 х 1074 2.11200 х 10% 2.112 х 108 
0.8 0.00422728 0.00434922 1.219 х 1074 — 1.53086 x 10% 1.531 х 108 
0.9 0.00222241 0.00228652 6.511 х 1077 8.03604 х 107 8.036 х 107 
1.0 0 0 0 


Consideraciones de estabilidad 


En el ejemplo 1 se espera un error de truncamiento de orden O(k + А2) A pesar de que esto 
se obtiene con h = 0.1 y k = 0.0005, sin duda alguna no se obtiene cuando h = 0.1 y k = 
0.01. Para explicar la dificultad, necesitamos observar la estabilidad del método de diferen- 
cias progresivas. 

Suponga que se comete un error е = ( 
iniciales 


е0 (0) ¿O 


t 
lo it ci) al representar los datos 


wO = (Р(х), f(),..., Fm) 


(o en cualquier paso particular, la selección del paso inicial es simplemente por convenien- 
cia). Un error de Ae% se propaga en w'” porque 


м = A(wO +0) = Aw® + де®. 


Este proceso continúa en el enésimo paso, el error en w” debido a e® es 4"e0). Por con- 
siguiente, el método es estable precisamente cuando estos errores no crecen conforme n se 
incrementa. Pero esto no es verdadero si y sólo si para cualquier error inicial e, tenemos 
Ае) | < ео | рага todas las и. Por lo tanto, debemos tener || А" || < 1, una condición 
que, mediante el teorema 7.15 en la página 332, requiere que о(А") = (p(A))" < 1. El mé- 
todo de diferencias progresivas es, por lo tanto, estable si y sólo si p(A) < 1. 

Es posible demostrar que los eigenvalores de A (consulte el ejercicio 15) son 


; 2 
ju = 14 sen (5) , paracadai=1,2,...,m-—1. 
2m 
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Por lo tanto, la condición para estabilidad, se reduce al determinar si 


К 5) 


| 2 
1 
0О<А[ sen a < =, рага сайа i = 1,2,...,m — 1. 
2т 2 


< 1, 


о(А) = máx 


l<i<m—1 


y esto se simplifica para 


La estabilidad requiere que esta condición de desigualdad se mantenga cuando л > 0, o, de 
forma equivalente, cuando m —> 00. El hecho de que 


А (т – Ол ү] 
lím | sen | =—— = 1 
т> 00 2m 


significa que se presentará estabilidad sólo si 0 < л < І. 
Por definición, А = œ? (k/h?), por lo tanto, esta desigualdad requiere seleccionar h у k 
de tal forma que 


En el ejemplo 1, tenemos a? = 1, por lo que esta condición se satisface cuando h = 0.1 y 
k = 0.0005. Pero cuando se incrementó k a 0.01 sin el aumento correspondiente en h, la 
razón fue 


0.01 


DOL ajet 
(0.1)? 2 
y los problemas de estabilidad se volvieron inmediatamente drásticos. 

Consistente con la terminología del capítulo 5, llamamos al método de diferencias pro- 
gresivas condicionalmente estable. El método converge en la solución de la ecuación (12.6) 
con la velocidad de convergencia O(k + h?), siempre y cuando 


y las condiciones de continuidad requeridas para la solución se cumplan. (Para una prueba 
detallada de este hecho, observe [IK], p. 502-505.) 


Método de diferencias regresivas 


Para obtener un método que es incondicionalmente estable, consideramos uno de diferen- 
cias implícitas que resulta del uso del cociente de diferencias regresivas рага (du/0t)(x;, tj) 
en la forma 


U(X;, tj) = и(Х, 13-1) + k д?и 
k 2 дг2 


ди 
gen) (Xi, Hj), 


donde uj está en (t;_1,1;). Al sustituir esta ecuación, junto con la ecuación (12.8) para 
9%4/9x?, en la ecuación diferencial parcial obtenemos 


u(xi, tj) = u(x;,tj-1) „2“ @+, E) = 2и(х{,1}) + u(xi—1, tj) 


k h? 
k 92и h? д%и 
= 5 ga 0) + НО 
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Figura 12.9 


Figura 12.10 


para algunas ё; € (x;_1, X;+1). El método de diferencias regresivas resultante es 


Wij Уыз _ pP 2wij + Wi-1,j 


А 7 =0, (12.12) 


paracadai=1,2,...,m=1yj=1,2,.... 
El método de diferencias regresivas implica los puntos de malla (x;, 1-1), Xi-1; tj), y 
(Xi+1, tj) para aproximar el valor еп (ху, tj), como se ilustra en la figura 12.9. 


о 
о 

o Método de 
O diferencias 
O regresivas 


o 


Puesto que las condiciones de frontera e iniciales relacionadas con el problema pro- 
porcionan información en los puntos de malla rodeados por un círculo, la figura no muestra 
procedimientos explícitos que se puedan utilizar para resolver la ecuación (12.12). Recuerde 
que en el método de diferencias progresivas (consulte la figura 12.10), las aproximaciones 
en (х1, fj-1), (Xi, 1-1), y (хен, 1-1) se usaron para encontrar la aproximación еп (x;, tj). 
Por lo que, se puede usar un método explícito para encontrar las aproximaciones con base en 
la información a partir de las condiciones iniciales y de frontera. 


о 
о 
о Método de 
o diferencias 
O progresivas 
о 
о 
о 


1 


Si, de nuevo, permitimos que à denote la cantidad о?(К/һҺ?), el método de diferencia 
regresiva se vuelve 


(1 + 25У — Ам, у — Аи; = Wi j-1, 


рага cada¡=1,2,...,m=—1yj=1,2,....Por medio del conocimiento que w¡o = f (xi), 
рага сада? =1,2,...,m—1 y иу = Wo,¡ = 0, para cada j = 1, 2,..., este método de 
diferencias tiene la representación matricial 
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(1424) =A, 0.....:...:... 0 
E “Бш ; Wij Wi jai 
о л Мэ, М2 j-1 
бо н ый МИ (= | > (12413) 
о е. 
Н Ы A Wm-1,j Wm-1,j-1 
(Оолак л 0 =i (1+22) 


о AwP = wU), para cadai=1,2,.... 


Por lo tanto, ahora debemos resolver el sistema lineal para obtener м‘ a partir de 
wD), Sin embargo, А > 0, por lo que la matriz A es definida positiva y estricta y diagonal- 
mente dominante, así como tridiagonal. Por consiguiente, podemos usar tanto el algoritmo 
de factorización de Crout 6.7 como el algoritmo SOR 7.3 para resolver este sistema. El 
algoritmo 12.2 resuelve la ecuación (12.13) por medio de factorización de Crout, lo cual es 
aceptable a menos que m sea grande. En este algoritmo, suponemos, con el fin de paro, que 
se da una cota para t. 


Diferencias regresivas de la ecuación de calor 


Para aproximar la solución de la ecuación diferencial parcial parabólica 
du Pu 
——(х,1) – 02—(х,1) = 0, O<x<!l, O<t<T, 
Э (x,t)-a az ) 


sujeta a las condiciones de frontera 
u(0,t) =u(1,t)=0, O<t<T, 
y las condiciones iniciales 
и(х,0) = (х), O<sx<l: 


ENTRADA extremo /; tiempo máximo Т; constante о; enteros т > 3, N > 1. 


SALIDA aproximaciones у; ¡para u(x;, tj) paracadai=1,...,m=1yj=1,...,N. 
Paso 1 Determine h = l/m, 

k=T/N; 

¿=0*%k/h?. 
Paso 2 Parai=1,...,m-— 1 determine w; = f (ih). (Valores iniciales.) 


(Los pasos 3-11 resuelven un sistema lineal tridiagonal por medio del algoritmo 6.7.) 


Paso З Determine / = 1 + 2А; 
иј = =А/Ц. 


Paso 4 Рага і = 2,... ‚т — 2 determine l; = 1 + 2А + Аи; 1; 
и; = —A/l;. 


Paso 5 Determine /„—1 = 1 + 2À + A4m-2. 
Paso 6 Рага ј = 1,... , N haga los pasos 7-11. 


Paso 7 Determine t = jk; (Actual tj.) 
zı =w/!. 


Paso 8 Parai=2,...,m-— 1 determine z; = (w; + Az¡-1)/l;. 


Paso 9 Determine и = Zm-1- 
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Ejemplo 2 


Tabla 12.4 


Paso 10 Parai =m —2,... ,1 determine w; = Zi — UiWi+1- 
Paso 11 SALIDA (1); (Nota:t = tj.) 
Para = 1,... ,m — 1 determine x = ih; 


SALIDA (х, w;). (Nota: w; = wi, j.) 
Paso 12 PARE. (El procedimiento está completo .) E 


Use el método de diferencias regresivas (algoritmo 12.2) con Л = 0.1 y k = 0.01 para aproxi- 
mar la solución de la ecuación de calor 


Т а }=0, 0 1, 0O<tf 
эг ©? 502 0 = 0), <x<l, <t, 


sujeta a las restricciones 
и(0,1) = и(1,1) = 0, O<t, и(х, 0) = ѕеплх, O<x<l. 


Solución Este problema se consideró en el ejemplo 1, donde encontramos que seleccionar 
h =0.1 y k = 0.0005 da resultados bastante exactos. Sin embargo, con los valores en este 
ejemplo, h = 0.1 y k = 0.01, los resultados fueron excepcionalmente pobres. Para demostrar 
la estabilidad incondicional del método de diferencias regresivas, utilizaremos h = 0.1 y 


k = 0.01 y nuevamente, comparamos w; so con u(x;, 0.5), donde = 0, 1,..., 10. 
Los resultados mostrados en la tabla 12.4 tienen los mismos valores de h y k que en la 
quinta y sexta columnas de la tabla 12.3, lo cual ilustra la estabilidad de este método. п 
Xi Wi,50 u (xi, 0.5) [wiso — u (x;, 0.5)| 
0.0 0 0 
0.1 0.00289802 0.00222241 6.756 x 107* 
0.2 0.00551236 0.00422728 1.285 x 107° 
0.3 0.00758711 0.00581836 1.769 х 107° 
0.4 0.00891918 0.00683989 2.079 х 107° 
0.5 0.00937818 0.00719188 2.186 х 107° 
0.6 0.00891918 0.00683989 2.079 х 10-3 
0.7 0.00758711 0.00581836 1.769 х 107° 
0.8 0.00551236 0.00422728 1.285 х 107° 
0.9 0.00289802 0.00222241 6.756 х 107* 
1.0 0 0 


La razón por la que el método de diferencias regresivas no tiene los problemas de esta- 
bilidad del método de diferencias progresivas se puede observar al analizar los eigenvalores 
de la matriz A. Para el método de diferencias regresivas (consulte el ejercicio 16), los eigen- 
valores son 


| 2 
л 

Ш: = 1445 sen 3] ,  paracadai=1,2,...,m-— 1. 
m 


Puesto que à > O tenemos u; > 1 para todas las i = 1, 2,..., т — 1. Puesto que los 
eigenvalores de A”? son los recíprocos de los de A, la relación espectral de A7! , о(А-!) < 1. 
Esto implica que А! es una matiz convergente. 

Un error e% en los datos iniciales produce un error (A7!)"e0 en el enésimo paso del 
método de diferencias regresivas. Ya que А! es convergente, 


lím (А7 1)"е0) = 0. 

n—>00 
Por lo que, el método es estable, independientemente de la selección de А = о? (k / h?). 
En la terminología del capítulo 5, llamamos al método de diferencias regresivas un método 
incondicionalmente estable. El error de truncamiento local para el método es de orden 


L. E. Richardson, quien, como 
observamos, está relacionado 
con la extrapolación, realizó 
un trabajo sustancial en la 
aproximación de ecuaciones 
diferenciales parciales. 


Para continuar su trabajo como 
físico matemático durante 

la Segunda Guerra Mundial, 
John Crank (1916-2006) 

realizó investigaciones sobre la 
solución numérica de ecuaciones 
diferenciales parciales, 

en especial, problemas de 
conducción de calor. El método 
de Crank-Nicolson se basa en 

el trabajo realizado por Phyllis 
Nicolson (1917-1968), un físico 
en la Universidad Leeds. Su 
artículo original sobre el método 
apareció en 1947 [CN]. 
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O(k + h°), siempre y cuando la solución de la ecuación diferencial satisfaga las condiciones 
de diferenciabilidad usual. En este caso, el método converge a la solución de la ecuación 
diferencial parcial con esta misma velocidad de convergencia (consulte [IK], p. 508). 

La debilidad del método de diferencias regresivas resulta del hecho de que el error de 
truncamiento local tiene uno de orden O(h?) у otro de orden O (k). Esto requiere hacer que los 
intervalos de tiempo sean mucho más pequeños que los intervalos del eje x. Sería claramente 
deseable tener un procedimiento con error de truncamiento local de orden ok + 0). ЕІ 
primer paso en esta dirección es usar una ecuación de diferencias que tiene error O(X?) para 
их, t), en lugar de los que hemos utilizado previamente, cuyo error era O(k). Esto se puede 
hacer usando la serie de Taylor en t para la función u (x, £) en el punto (x;, tj) y al evaluar en 
(Xi, tj+1) y (х, tj—1) para obtener la fórmula de diferencias centradas 


du u(xi, tj41) —u(xi tj), 0% 
zi, tj) = 
97010) 2k ra 


Оч, Hj), 


donde ш; € (tj-1, ;+1). El método de diferencias que resulta de sustituir esto y el cociente 
de diferencias usual para (д?и / 9x?), la ecuación (12.8) en la ecuación diferencial recibe el 
nombre de método de Richarson y está dado por 


Wij41 МИЕ, j-1 а? Wi+l,j Z 2wij + иг, 
2k h? 


Este método tiene error de truncamiento local de orden O(k? + h°), pero, por desgra- 
cia, al igual que el método de diferencia progresiva, tiene serios problemas de estabilidad 
(consulte los ejercicios 11 y 12). 


= 0. (12.14) 


Método de Crank-Nicolson 


Un método más prometedor se deriva al promediar el método de diferencias progresivas en 
el j-ésimo paso en t, 


Wi j+1— Wij 


д2 ЕШ 2wi j +Wi-1,j 


k h? к. 
que tiene error de truncamiento local 
k д?и 2 
Тр = 2 972 ©? ш) + Оф”), 
y el método de diferencias regresivas en el (j + 1)ésimo paso en t, 
Wij Wij Wi 2w; j41 + Wi-1, 541 =й, 


k h? 


que tiene error de truncamiento local 


k д?и E 2 
тв = 555 Оң, 45) + О(А). 
Si suponemos que 
д?и А ди 
эп ©? Ёу) ~ эп №) 


entonces, el método de diferencia promediado, 


2 
Wi j+ — Wij а Wi41 — 2Wi, j + Wi-1,j + Wi+1,j41 — 2Wi 541 А Wizji] _ 0 
[4 2 h? h? і 
tiene error de truncamiento local de orden O(k? + h’), siempre y cuando, por supuesto, se 
satisfagan las condiciones de diferenciabilidad comunes. 
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Esto se conoce como el método de Crank-Nicolson y se representa en forma de matriz 


Ам) = BwW, рага сайа ј = 0, 1, 2,..., (12.15) 
donde 
2 k G) t 
A=0 ы М = (Wijs Wa р... Wm-=1,7)", 


у las matrices A у В están dadas рог: 


(1+А) Е ООРОО 0 
A 

А= |0 0 

ОУ 0 —4 (1+) 
y 

(1А) E Desrasrasras 0 

Ate : 

2. т 

В = 0 0 

Е" 

05 
Ос 0 5 (1-1) 


La matriz no singular A es definida positiva, estricta y diagonalmente dominante y tri- 
diagonal. Se puede usar tanto la factorización de Crout 6.7 como el algoritmo SOR 7.3 para 
obtener w/+1 a partir de w(?”, para cada j =0,1,2,.... El algoritmo 12.3 incorpora la 
factorización de Crout en la técnica Crank-Nicolson. Como en el algoritmo 12.2, una longi- 
tud finita para el intervalo de tiempo se debe especificar para determinar un procedimiento 
de detención. La verificación de que el método de Crank-Nicolson es incondicionalmente 
estable y tiene orden de convergencia O(k? + h?) se puede encontrar en [IK], p. 508-512. 
Un diagrama que muestra la interacción de los nodos para determinar una aproximación en 
(xj, tj+1) se muestra en la figura 12.11. 


Figura 12.11 


o 
о 

о Método 
о Crank- 

O Nicolson 
o 

о 

о 


І 
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Método Crank-Nicolson 


Para aproximar la solución de la ecuación diferencial parcial parabólica 
Maya =0. 0<x<if 0 ЕТ, 
sujeto a las condiciones de frontera 
u(0,t)=u(1,1t)=0, O<t<T, 
y las condiciones iniciales 
и(х,0) = f(x), O<x<l: 
ENTRADA extremo /; tiempo máximo T; constante о; enteros m > 3, N > 1. 


SALIDA aproximaciones w; ; para и(х;, tj) para сайаі = 1,...,т-1уј = 1,..., №.. 


Paso 1 Determine Л = l/m; 


к= Т/М; 
А = о2к/ №2; 
Wm = 0. 
Paso 2 Рага і = 1,...,т — 1 determine w; = (іл). (Valores iniciales.) 


(Los pasos 3-11 resuelven un sistema lineal tridiagonal por medio del algoritmo 6.7.) 


Paso 3 Determine / = 1 + å; 
иј = =A/Ql;). 


Paso 4 Parai =2,... ,m — 2 determine l; = 1 + à + Аи; 1/2; 
ui = —À/(2l;). 


Paso 5 Determine lm-1 = 1 + À + Au m-2/2. 
Paso 6 Para ј = 1,... , N haga los pasos 7-11. 


Paso 7 Determine t = jk; (Actual tj.) 


a |а 1) + qu 7 А. 


Paso 8 Рага i = 2,...,т — 1 determine 


A 
g= а = Эн + zin + и; + a) Ju 


Paso 9 Determine иу = Zm-1- 


Paso 10 Para i =m — 2,..., 1 determine w; = Zi — им. 
Paso 11 SALIDA (t); (Nota:t = tj.) 
Para i = 1,... ,m — 1 establezca x = ih; 


SALIDA (х, w;). (Nota: wi = м; у.) 
Paso 12 PARE. (El procedimiento está completo .) п 
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Ejemplo 3 


Tabla 12.5 


Use el método Crank-Nicolson con h = 0.1 y k = 0.01 para aproximar la solución del pro- 
blema 


ар Èr )=0, 0 ooet 
— (x,t) – — (x,t) = 0, <x< <t, 
дї дх2 


sujeto a las condiciones 


u(0,t) = и(1,1) = 0, O<t, 


и(х,0) = ѕеп(лх), 0 <х < 1. 


Solución Al seleccionar h = 0.1 y К = 0.01 obtenemos m = 10, № = 50, ул = 1) enel algo- 
ritmo 12.3. Recuerde que el método de diferencia progresiva provee resultados drásticamen- 
te pobres para esta selección de h y k, pero el método de diferencias regresivas da resultados 
que eran exactos alrededor de 2 X 107° para entradas en medio de la tabla. Los resultados en 
la tabla 12.5 indican el incremento de exactitud del método Crank-Nicolson sobre el método 


de diferencias regresivas, la mejor de las dos técnicas previamente analizadas. o 
Xi Wi,50 u(x;, 0.5) [wi so — u (x;, 0.5)| 
0.0 0 0 

0.1 0.00230512 0.00222241 8.271 x 10% 
0.2 0.00438461 0.00422728 1.573 x 1074 
0.3 0.00603489 0.00581836 2.165 x 1074 
0.4 0.00709444 0.00683989 2.546 x 1074 
0.5 0.00745954 0.00719188 2.677 x 1074 
0.6 0.00709444 0.00683989 2.546 x 1074 
0.7 0.00603489 0.00581836 2.165 x 1074 
0.8 0.00438461 0.00422728 1.573 x 1074 
0.9 0.00230512 0.00222241 8.271 x 1075 
1.0 0 0 


La sección Conjunto de ejercicios 12.2 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


Ecuaciones diferenciales parciales hiperbólicas 


En esta sección consideramos la solución numérica de la ecuación de onda, un ejemplo de 
una ecuación diferencial parcial hiperbólica. La ecuación de onda está dada por la ecuación 
diferencial 


92 
ot 


и › 2и 
zt) 77 (х,1) = 0, O<x<Il, 1>0, (12.16) 
dx? 


sujeta a las condiciones 
u(0,t) =u(l,t) = 0, раа £>0, 


и(х,0) = f(x), y 0) =860, para 0<х </, 


donde о es una constante dependiente de las condiciones físicas del problema. 
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Seleccione un entero m > O para definir los puntos de cuadrícula del eje x haciendo 
h = l/m. Además, seleccione un tamaño de longitud de paso-tiempo k > 0. Los puntos de 
malla (x;, tj) están definidos por 


Хі =ih y 13 = ЈК, 


рага сайа і = 0, 1,...,m y j = 0, 1,.... 
En cualquier punto de malla interior (x;, tj), la ecuación de onda se vuelve 


du 292и 
912 (xj, tj) Q 5522600) = 0. (12.17) 


El método de diferencias se obtiene a través del cociente de diferencias centradas para 
las segundas derivadas parciales dadas por 
vu. o u(xi, л) = 2и(х;, tj) Hui, tia) 2 a*u 
an Wi tj) = 
T k? 12 art 


(х, шу), 


donde шу є (tj-1,£j41), y 


e TE их, tj) — 2u (xi, tj) + u (xi ti) А2 ди 
х2?” h2 12 ðx4 


i, tj), 


donde &; € (xi—1, X;+1). Al sustituir éstas en la ecuación (12.17) obtenemos 


U(Xi, ір) = 2U(X%;, tj) + u(x;, tj-1) x u(xi+i; tj) — 2u (xi, tj) + u(%j-1,£;) 


k2 h? 
T f g3 u zad u 
= ЯГ эн Ое? h ga (810) . 


Al ignorar el término de error 
1 ѓи | 2 ‚д%и 
Tij = al е h ga (810) , (12.18) 


obtenemos la ecuación de diferencias 


Wij S 2Wj, + Wi j-1 o? Мрт, T 2w;,j Ит. 


k2 h2 = 


Defina à = ak/h. Entonces, podemos escribir la ecuación de diferencia como 
“ун — 2Wi, j + Wi ja — Ai у Ё 207 у – Аиа, =0 
y resolver рага w; ът, la aproximación de longitud de paso-tiempo, para obtener 
wi уы =2(1 — Awi у + Ag j Wiig) — Wij- (12.19) 


Esta ecuación se mantiene рага cada į = 1, 2,...,т-1уј = 1, 2,.... Las condiciones de 
frontera proporcionan 


woj =Wm,¡ = 0, para cada ¡ = 1, 2, 3,..., (12.20) 
у la condición inicial implica que 


wio = F(x;), para cadai = 1,2,...,m— 1. (12.21) 
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Escribir este conjunto de ecuaciones en forma matricial nos da 


21-14) А буду ы 0 
WI, j+1 2 2—2) R 7 : wij wi, j-i 
W2, j+1 aa ра КУ. w2,¡ W2,j-1 
. э. 7 
Wm-1,j+1 E Wm=1,j Wm=1,j-1 
ОУУ ООО a 00012 2(1 А2) 


(1222) 


Las ecuaciones (12.19) y (12.22) implican que el (j + 1)-ésimo paso requiere valores des- 
de el ¡j-ésimo y (j — 1)-ésimo pasos. (Consulte la figura 12.12.) Esto produce un pequeño 
problema inicial porque los valores de j = O están dados por la ecuación (12.21), pero los 
valores para j = 1, necesarios en la ecuación (12.19) para calcular w; з, deben obtenerse а 
partir de la condición de velocidad inicial. 


ди 
zeA = 2(х), O<x<l. 


Figura 12.12 


о 
(еј 
о 
о 
(еј 
о 
[ө] 
[ө] 


~ 


Un enfoque es reemplazar ди /9t mediante una aproximación de diferencias progresiva 


u(x;, ti) —u(x;,0)  k0%u 


п 5 gg © й), (12.23) 


ди 
— (х,0) = 
ðt Cr, 0) 


para algún ñ; en (0, tı). Al resolver para u(x;, tı) en la ecuación obtenemos 


и(х;, ti) = и(х; ne yg EY, A 
1 > дї ES 2 912 ES 1 
лл. Ж 
| 2 at~? 


Al borrar el término de truncamiento, obtenemos la aproximación, 
wii = Wio + kg(x;), para cadai = 1,...,m— 1. (12.24) 


Sin embargo, esta aproximación tiene error de truncamiento de sólo O(k), mientras el error 
de truncamiento en la ecuación (12.18) es 0(0). 
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Mejora de la aproximación inicial 


Para obtener una mejor aproximación para и(х;, 0), expanda u(x;, t1) en un segundo polino- 
mio Maclaurin en t. Entonces 


k2 д?и 3 Зи 
иби, п) ио O HK 0) 5 00,04% a? an 

para algunas 2; еп (0, гу). Si f” existe, entonces 

2u „9° 

= 0» ®) = 05 (41,0) = 002 TI а) а? f") 
y 

3 33u 
иби) =u O Hga + Efe ) + = 6 21 E (к, а). 


Esto produce una aproximación con error О (К): 
Wil = wio + kg(xi) + — E ian, 


Sif e C*[0, 1] pero f”(x;) no está disponible fácilmente, podemos usar la ecuación de 
diferencias en la ecuación (4.9) para escribir 


fii) — 2f xi) + РО) 
h2 


ылу = h? (WE 
Fx) 157 (81), 


para algunas Ёё, en (х1, Xi+1). Esto implica que 
229 


Кта 
и(х;, й) = == u(x;, 0) + kg (xi) Fa 


Эр [/ Очы) —2/ (кх) + f(-1)1 + O(k? + 202). 


Puesto que А = kæ/h, podemos escribir esto como 
u(x;, t1) = и(х, 0) + kg (xi) +2 ео = 200) + Ро 1) + О( + А22) 
2 А А2 3 212 
= (1) 400) + $ ы) + ua) + kgl) + 000 + А200). 
Por lo tanto, la ecuación de diferencias, 
А А? 
wia = (1 А) РО) + y Оен) + y Ei) + Као), (12.25) 


se puede w; ¡ usar para encontrar і = 1, 2,..., т 1.Рага determinar aproximaciones sub- 
siguientes, usamos el sistema en la ecuación (12.22). 

El algoritmo 12.4 usa la ecuación (12.25) para aproximar у; |, a pesar de que la ecua- 
ción (12.24) también podría usarse. Se supone que existe una cota superior para el valor de t 
que se puede utilizar en la técnica de detención y que k = T/N , donde N también está dada. 
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Diferencias finitas para la ecuación de onda 
Para aproximar la solución de la ecuación de onda 


д?и 


д?и 
320-0 95500 = 0, O<x<l, 0 < =< Т7, 


sujeta las condiciones de frontera 
u(0,t)=u(1,1t)=0, O<t<T, 


y las condiciones iniciales 


и(х,0) = fx), y 0) = О). para О<х</, 


ENTRADA extremo /; tiempo máximo T; constante о; enteros m > 2, N > 2. 


SALIDA aproximaciones и; ¡para u(x;, tj) para cada i = 0,...,т уј = 0,..., №. 
Paso 1 Determine h = l/m; 

k=T/N; 

А = Ко/һ. 
Paso 2 Para ј = 1,... , N determine wo у = 0; 

Waj = 0; 

Paso 3 Determine woo = f (0); 

Wm, = РО). 
Paso 4 Parai=1,...,m—1 (Inicialice parat = 0 у t= k.) 


determine w; o = f (ih); 
А 
wa = (1 А2) РОА) + zG + 1)^) + f (i — 1)h)] + kg(ih). 


Paso 5 Рага j=1,...,N —1 (Realice la multiplicación de matriz.) 
para i = 1,...,m— 1 
determine Wi j+1 = 2(1 — aw; j + Win + Wi—1,j) = Wij 


Paso 6 Para j=0,...,N 
determine г = jk; 
para i = 0,...,т 
determine x = ih; 
SALIDA (x,t, Wij). 


Paso 7 PARE. (El procedimiento está completo.) E 


Ejemplo 1 Aproxime la solución del problema hiperbólico 
ЖР У Е )=0, 0 1, 0<t 
— (x,t) – 45 (x,t) = 0, = х < 1, <t, 
дї? дх? 
con condiciones de frontera 


u(0,t) =u(1,1) = 0, para0 <t, 


y condiciones iniciales 


д 
и(х,0) = ѕеп(лх), O<x<l, y 210.0) = 0, O<x<l, 


Tabla 12.6 

Xi Wi,20 

0.0 0.0000000000 
0.1 0.3090169944 
0.2 0.5877852523 
0.3 0.8090169944 
0.4 0.9510565163 
0.5 1.0000000000 
0.6 0.9510565163 
0.7 0.8090169944 
0.8 0.5877852523 
0.9 0.3090169944 
1.0 0.0000000000 
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Usando h = 0.1 y k = 0.05. Compare los resultados con la solución exacta 
u(x,t) = Sen Tx cos 2л. 


Solución Al seleccionar h = 0.1 y k = 0.05 da à = 1, т = 10, y N = 20. Seleccionaremos un 
tiempo máximo T = 1 y aplicaremos el algoritmo de diferencias finitas 12.4. Esto produce 
las aproximaciones и; y a u(0.li, 1) para i =0,1,..., 10. Estos resultados se muestran en 
la tabla 12.6 y son correctos para los lugares dados. п 


Los resultados del ejemplo eran muy exactos, más de lo que el error de truncamiento 
О(К?+ h°) nos permitiría creer. Esto es porque la verdadera solución para la ecuación es 
infinitamente diferenciable. Cuando éste es el caso, la serie de Taylor da 


u(xi+1, tj) = 2U(x;, tj) + и(х—1,1)) 


h2 
д?и А2 д 44 ht би 
= вооа [552 g i tj) + саб (ки | 
y 
u(xi, ір) — 2U (xi, tj) + u(x;, 1-1) 
k2 
du k2 du 4 Su 
= 19 +2 i р ent) |. 


Puesto que u(x, t) satisface la ecuación diferencial parcial, 


u(xi, іу) — Zu (xj, tj) + u(x;,fj-1) PELA lis tj) — 2u(x;, tj) + u(xj-1, tj) 
k2 h2 


28u 
4 Ол, tj) 
дби 
Pht 9x6 Gi, 0) T 


Sin embargo, al diferenciar la ecuación de onda obtenemos 


tu 
k? T (x;, tj) — 02h 


1 / ,д%и 
F k 516 (xi, tj) 


ч Я! (12.26) 


atu 9? д?и д2 ГӘ2и 
кс q, tp) = ei ei бгр] = e э E) 


32 du ѓи 
= e o 2] = EE tj), 


y observamos que puesto que А2 = (œ?k?/ h?) = 1, tenemos 


1 p” u 
4! Ет: 


2 4 
0% 2,2 „ди 
k h 

[а lya 


4! (xi, tj) = 0. 


29%и 
(xi, tj) а?л? 3x 16.10 = 
Al continuar de esta forma, todos los términos en el lado derecho de la ecuación (12.26) son 0, 
lo que implica que el error de truncamiento local es 0. Los únicos errores en el ejemplo 1 
son los que se deben a la aproximación de w; у al de redondeo. 

Como en el caso del método de diferencias progresivas para la ecuación de calor el mé- 
todo de diferencias finitas explícita para la ecuación de onda tiene problemas de estabilidad. 
De hecho, es necesario que à = ak/h < 1 para que el método sea estable. (Consulte [IK], 
р. 489.) El método explícito dado en el algoritmo 12.4,con4 < 1 es O(h? + 0) convergente 
si fy g son suficientemente diferenciables. Para verificarlo consulte [IK], p. 491. 
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A pesar de que no los analizaremos, existen métodos implícitos que son incondicionalmen- 
te estables. Un análisis de estos métodos se puede encontrar en [Am], р. 199, [Mi] o [Sm, В]. 


La sección Conjunto de ejercicios 12.3 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WEN 12.4 Una introducción al método de elementos finitos 


Los elementos finitos 
comenzaron en la década 

de 1950 en la industria de 

las aeronaves. Al uso de las 
técnicas le siguió un artículo de 
Turner, Clough, Martin, y Topp 
[TCMT] que fue publicado en 
1956. La amplia aplicación de 
los métodos requería grandes 
recursos computacionales que 
no estuvieron disponibles hasta 
principios de la década de 1970. 


Figura 12.13 


El método de elementos finitos es similar al método de Rayleigh-Ritz para aproximar la 
solución de los problemas de valor en la frontera para dos puntos que se presentó en 
la sección 11.5. Fue desarrollado originalmente para su uso en ingeniería civil, pero ahora 
son útiles en la aproximación de las soluciones para las ecuaciones diferenciales parciales 
que surgen en todas las áreas de las matemáticas aplicadas. 

Una ventaja que tiene el método de elementos finitos sobre los métodos de diferencias 
finitas es la relativa facilidad con la que se manejan las condiciones de frontera del pro- 
blema. Muchos problemas físicos tienen condiciones de frontera que implican derivadas y 
fronteras de formas irregulares. Dichas condiciones son difíciles de manejar con técnicas de 
diferencias finitas porque cada condición en la frontera que implica una derivada se debe 
aproximar mediante un cociente de diferencias en los puntos de cuadrícula y una forma 
irregular de la frontera hace que colocar los puntos de la cuadrícula sea difícil. El método 
de elementos finitos incluye las condiciones de frontera como integrales en una función que 
se está minimizando, por lo que el procedimiento de construcción es independiente de las 
condiciones de frontera particulares del problema. 

En nuestro análisis, consideramos la ecuación diferencial parcial 


д ди д ди 
Z (vo Me) + С 9 + г(х, у)и(х, y) = Fo, y), (12.27) 
х дх ду ду 


con (х, у) є D, donde D es una región plana con frontera S. 
Las condiciones de frontera de la forma 


u(x, y) = g(x, y) (12.28) 


se imponen en una parte, S4, de la frontera. En el resto la frontera, S2, se requiere la solución 
u(x, y) para satisfacer 


ди ди 
р(х, A y) cos O +q(x, У эу у) сов 9, + gı (x, у)и(х, у) = g2(x, y), 
(12.29) 


donde 0; y 6, son los ángulos de dirección de la normal exterior para la frontera en el punto 
(x, y). (Consulte la figura 12.13). 


Recta tangente 


Recta normal 


Figura 12.14 
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Los problemas físicos en las áreas de la mecánica sólida y la elasticidad tienen ecua- 
ciones diferenciales parciales relacionadas similares a la ecuación (12.27). En general, la 
solución del problema de este tipo minimiza cierta función, que implica integrales, sobre una 
clase de funciones determinadas por el problema. 

Suponga que p, q, r y f son todas continuas en D US, y que q tiene primeras deri- 
vadas parciales continuas y gı y g2 son continuas еп $. Suponga, además, que p(x, y) 
0,q(x,y) > 0,r(x, y) < 0, y а(х, y) > 0. Entonces, una solución de la ecuación (12.27) 
solamente minimiza la función 


1 ðw ү ðw ү А 
m= Јао (зк) na) rt] +a ако 
D x dy 
+ -ea yw zaa} dS (12.30) 
S2 


sobre todas las funciones dos veces continuamente diferenciables w que satisfacen la ecua- 
ción (12.28) еп Sı. El método de elementos finitos aproxima esta solución al minimizar la 
función / sobre una clase más pequeña de funciones, justo como el método de Rayleigh-Ritz 
para el problema de valor en la frontera considerado en la sección 11.5. 


Definición de elementos 


El primer paso es dividir la región en un número finito de secciones, o elementos, de una 
forma regular, ya sea rectángulos o triángulos. (Consulte la figura 12.14.) 


En general, el conjunto de funciones que se usa para la aproximación es un conjunto de 
polinomios por tramos de grado fijo en x y y, y la aproximación requiere que los polinomios 
se reconstruyan de tal forma que la función resultante sea continua con una primera o segun- 
da derivada integrable o continua en toda la región. Los polinomios de tipo lineal en x y y, 


фо, у) =a+bx+cy, 


se usan comúnmente con elementos triangulares, mientras que los polinomios de tipo 
bilineal en x y y, 


ф(х, y) =a + bx+cy+dxy, 


se utilizan con elementos rectangulares. 

Suponga que la región D se ha subdividido en elementos triangulares. El conjunto de 
triángulos se denota como D y los vértices de estos triángulos reciben el nombre de nodos. 
El método busca una aproximación de la forma 


фб, у) = Y иф, у), (12.31) 
i=] 


570 CAPÍTULO 12 = Soluciones numéricas para ecuaciones diferenciales parciales 


donde фі, фо, ..., Øm son polinomios lineales por tramos linealmente independientes y 
У, №, --- > Ym Son constantes. Algunas de estas constantes, por ejemplo, Yn+1, Yn+2> +++ > Ут 
se usan para garantizar que la condición de frontera, 


ф(х, у) = 8(х, y), 
se satisfaga еп Sı y las constantes restantes у, у, ..., Yn, se usan para minimizar la fun- 
ción Т [Уч уф | x 
Reemplazando la forma de ф(х, у) dada en la ecuación (12.31) para w en la ecuación 
(12.30) produce 


Фф] =1 p3 z 
1=1 


т дф, 2 т дф, 2 
- ff G fro. ne] +9 | 0) 


i=1 


m 2 m 
=r(x, y) DTS » К + Ро, у) У ифих, ») dy dx 
i=1 


і=1 


т 1 т 2 
+/ (209 у ифа, + зно) vt) pas. (12.32) 
2 1=1 1=1 


Considere / como una función de у, у, ..., Yn- Рага que se presente un mínimo, 
debemos tener 
ol j 
—— =0, paracada ¡=1,2,...,n 
ду; 


Derivando (12.32) obtenemos 


m 


эу = //» (pa, YA _ 0, у) "е, y) 


22 


+40, эу зу E» 


т 


= пх, у) Ууф, у)фу(х, y) + РО, у)фу(х, »} dx dy 


і=1 


т 


+/ (20959 + еа, э) naa, дуо, y) a 
ш: і=1 


por Іо que 


5 fro. уай о, уай о, aa) а y) LO y) 


1=1 


= r(x, у)ф:(х, у)фу(х, »} dx dy 
+/ аб. фи, yea у) 48] 
ыд, 


+/ „© ?%@®,у) de ay- f 82(х, у)фу(х, у) dS, 


S2 


Ilustración 
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para сайа j = 1,2,... ‚п. Este conjunto de ecuaciones se puede escribir como un sistema 
lineal: 

Ac = b, 
donde с = (y1, ..., Yn)! y donde las matrices n X n A = (015) y b = (B1,..., Bn) están 
definidas por 


= ||. [ (х,у) 7 rS 90) 0,5) +400, у) r у б, Ha di 0, y) (12.33) 


чымы ах dy+ f 810, yix, у)фу(х, у) 45, 


52 


para cada i = 1,2,...,n y j = 1,2,...,m, 


=- ff fœ, уф, y) dx ay f 82x, у)ф:(х, у) 45 — У оку (12.34) 


k=n+1 


paracadai=1,...,n. 

La selección particular de las funciones base es importante porque, a menudo, la se- 
lección adecuada puede crear la matriz definida positiva y de banda A. Para el problema de 
segundo orden (12.27), suponemos que D es poligonal, de tal forma que D = D, y que S es 
un conjunto contiguo de líneas rectas. 


Triangulación de la región 


Para comenzar el procedimiento, dividimos la región D en un conjunto de triángulos 
ТІ, Т,... , Tm, con el ¡-ésimo triángulo con tres vértices, o nodos, denotados 


ўе (х Dyr) para j = 1:2; З; 


Para simplificar la notación, escribimos у? simplemente como V; = (xj, yj) cuando traba- 
jamos соп el triángulo fijo T;. Con cada vértice Ү;, asociamos el polinomio lineal 


1, sij=k, 


Dr zZ И — 5 (i) = 
N; (х,у) = N;@,y)=aj+bjx+cjy, donde М; мо (6 dj 


Esto produce sistemas lineales de la forma 


1 X1 yı aj 
1 Хо у?» b; = 1 б 
1 хз y С} 


con el elemento 1 presente en la j-ésima fila en el vector de la derecha (aquí = 2). 

Sean Ej¡,... , E, etiquetas de los nodos еп D U S. Con cada nodo Ex, asociamos una 
función ф; que es lineal en cada triángulo, tiene el valor 1 en Ex y es O en cada uno de los 
otros nodos. Esta selección е que ф sea idéntico а N; © en el triángulo Т; cuando el nodo 
E, es el vértice denotado ví 


Suponga que un problema de elementos finitos contiene los triángulos Tı y Т, mostrados en 
la figura 12.15. 
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Figura 12.15 


La función lineal № Oie, y) asume el valor 1 en (1, 1) y el valor О tanto en (0, 0) como en 
(— 1,2) satisface 


aC AA = 1, 


aP + Do) +c 2) = 0, 


a +600) + cO) = 0. 


La solución a este sistema es a =0 „БР = 2, y o = $, por lo que 


а) 2 1 
Ni (х, у) = Шш + 3» 


De manera similar, la función lineal N 8 (х, у) toma el valor 1 en (1, 1) y el valor 0 tanto en 
(0, 0) como en (1, 0) satisface 


а? +ь?(1)+с?(@) =1, 


aP +b (0) + сү O) =0, 


a® +bP A) +c% (0) =0. 


Esto implica que ap =0, Бе) =0,y 20 = 1. Como consecuencia, ү? (х,у) = y. Note 
que NO (x, y)= NO (х, y) sobre la frontera común de Т y T puesto que y = x. ш 


Considere la figura 12.16, la parte izquierda superior de la región mostrada en la figura 
12.12. Nosotros generaremos las entradas en la matriz A que corresponde a los nodos mos- 
trados en esta figura. 
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Figura 12.16 
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Para simplicidad, suponemos que ЕЁ es uno de los nodos еп <, donde la condición 
de frontera u(x, y) = g(x, y) es impuesta. La relación entre los nodos y los vértices de los 


triángulos para esta parte es 


E; = VP = 


VO, Е = ү), E 


= yo — ve, y E> == = У{?. 


Puesto que фу y фз son ambos diferentes a cero еп Тү у Т», las entradas оз = оз se calculan 


por medio de 


= eet 
a= дх а 


_ дф дфз 
=J, С дх щ 


дф\ д 

Фі 003 pida йу 
ду ду 

дф\ д 

Ф908 _ фф, | dx dy 
ду ду 


дф дф» 


дф дфз 
Sf | дх +8 


En el triángulo Т, 


— dx dy. 
dy dy о х ау 


фб, у) = NI? Œ, у) = а? + 0х +03) y 


фз(х, у) = NP, y) 


рог lo que para todas las (х, у), 


De igual forma, en 7», 


эф _ 


1 1 1 
= аў? + ЫРх-єсР?у, 


дх 


фик, у) = NO (x, у) = а? +Ь?х+сРу 


фзбх, у) = NP, y) =а0 + dx + oy, 
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por lo que todas las (x, y), 


ә ә ð ә 
Че ЫЕ. К. ж y ш 
дх ду дх ду 


Por lo tanto, 


01,3 = рв J рах ау + єс? /] q dx dy 
Ti Ti 


- ff ао ых SNS AI) ахау 
Tı 


+ь®ь® / / рахау+с®г® | | q dx dy 
T T 


= J r (а? +Ь?х+ cy) (ap +bPx + с?) ах ду. 
T 


Todas las integrales dobles sobre D reducen las dobles integrales sobre los triángulos. El 
procedimiento normal es calcular todas las integrales posibles sobre los triángulos y acumu- 
larlas en la entrada correcta оу; en A. De igual forma, las dobles integrales de la forma 


J| roman dx dy 


se calculan sobre triángulos y, después, se acumulan en la entrada correcta В; del vector b. 
Por ejemplo, para determinar £1, necesitamos 


- || teaa у)4х йу || уе, э] +0 0x4 Py] ахау 
р Ti 
— 1. Fx, la? +bPx +cPy] dx dy. 
2 


Puesto que Ej es un vértice tanto de Тү como de 7», la parte de £; está contribuida por фі, 
restringida a T; y el resto por фу restringida por 7). Además, los nodos que se encuentran en 
S tienen incorporadas integrales lineales a sus entradas en A y b. 

El algoritmo 12.5 realiza el método de elementos finitos en una ecuación diferencial 
elíptica de segundo orden. El algoritmo establece inicialmente todos los valores de la matriz 
A y el vector b en 0 y, después, realiza todas las integraciones en todos los triángulos, añade 
estos valores a las entradas adecuadas en A y b. 


Método de elementos finitos 


Para aproximar la solución de la ecuación diferencial parcial 


ə ə д д 
= (ра, у) + Эу (ac, йш +т(х,у)и = f(x,y), (x,y)eD 


sujeta a las condiciones de frontera 
u(x, y) =8(%,y), (4, y) є 81 
y 


ди ди 
р(х, у) 56 у) соѕ0 +q(x, У уб у) соз 02 + gı (x, у)и(х, у) = g2(x, y), 


(х,у) € S, 
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“чы donde S; US, es la frontera de D y Ө, y Ө» son los ángulos de dirección de la normal рага 
la frontera: 


Paso 0 Divida la región D en triángulos T,,... , Ту de tal forma que: 
Ti, ... , Tg son los triángulos sin bordes en $, o $; 
(Nota: К = 0 implica que ningún triángulo es interior para D .) 
Tk+1) +... , Ty son triángulos con al menos un borde en $»; 
Tw+1, ++. , Тм son los triángulos restantes. 
(Nota: М = N implica que todos los triángulos tienen bordes еп $.) 
Etiquete los tres vértices del triángulo Т; mediante 
(20,20), (0,0), y (0,0). 
Etiquete los nodos (vertices) E1, ... , Em donde 
E¡,..., E, están en DUS) y Eny1,... , Em están en $]. 
(Nota: п = m implica que S, no contiene nodos.) 


ENTRADA enteros K, N, M, п, т; vértices (=P, s?) E о х0) , (х0, у?) 
para cada i =1,... , M; nodos E; para cada j = 1,..., т. 


(Nota: Todo lo que se necesita es un medio para corresponder a un vértice (х0, ›?) 
para un nodo E j = (ху, y;).) 


© 


j para cada j = 1,2 yi = 1,..., M. 


SALIDA constantes y1, ... , Ym; а®, po, К 


Paso 1 Paral=n+1,... ‚т determine у = (ху, у). (Nota: Е = (х, y1).) 


Paso 2 Parai =1,...,n 
determine В; = 0; 
рага j = 1,... ‚п determine о; ; = 0. 


Paso 3 Parai=1,...,M 
1 © © 


х yı 
determine A; = det |1 xP yP 
Loap yp 
10,0 0,0 (0) (0) (1) (0) 
ü ху Уз = уз ху р ь® = уз = Уз А (0) ху > ху . 
а A 1 === 8 Ci шш 53 
А; А; А; 
0,0 0,0 (0) (0) (1) (0) 
DLB Уу TRA, p- B — ур, @ _ А3, 
a) — , g == ES C) == —— a 
А; А; А; 
(10,0 (0,0 (1) (1) (1) (0) 
o у. һ® — у=, o 2 x, 
a3 == , ==» = тт т=з Сз A A + 
А; А; А; 
рага ј = 1,2,3 
defina №? (х, у) = а + bP x + соу. 
Paso 4 Рагаі = 1,..., М (Газ integrales en los pasos 4 у 5 se pueden evaluar 
por medio de integración numérica.) 
рага j = 1,2,3 
parak = 1,..., j (Calcule todas las integrales dobles sobre los triángulos .) 


determine an = DODË Л, p(x, y) dx dy + еер Л, q(x, у) dx dy 
= ffyr Es VN? (х, y)NË (х, y) dx dy; 
determine H® = -Jf A, умо (x, y)dx dy. 


Paso 5 Parai = К +1,...,N (Calcule todas las integrales lineales. ) 
рага ј = 1,2,3 
parak=1,...,/ 
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determine Jj} = / ваб, YN NO, y) dS; 
$ 


determine 1/? = / ga, INP (х, у) 45. 
S2 
Paso 6 Para i = 1,... , M haga los pasos 7-12. ( Ensamble las integrales sobre cada 
triángulo en el sistema lineal.) 


Paso 7 Рага К = 1, 2, З haga los pasos 8-12. 
Paso 8 Encuentre / de modo que E; = Ese yo) А 
Paso 9 Sik > 1 entonces рага j = 1,... ,k— 1 haga los pasos 10, 11. 


Paso 10 Encuentre t de modo que E, = (=P А y? ) 7 
Paso 11 Sil < п determine 


511 < п entonces determine о, = а; + a 


(0 
Оп = An + Zk j 


и, 


si no determine В; = В; 
si no 
517 < n entonces determine В, = В; — и). 
Paso 12 Sil < п entonces determine аџ = оџ + 
Bi = В + HË. 
Paso 13 Para i = K +1,... ‚М haga los pasos 14—19. ( Ensamble las integrales lineales 
en el sistema lineal.) 


Paso 14 Para К = 1, 2, З haga los pasos 15-19. 
Paso 15 Encuentre / de modo que E, = (х, yo) " 
Paso 16 Sik > 1 entonces рага j = 1,... ,k — 1 haga los pasos 17, 18. 
Paso 17 Encuentre £ de modo que E, = e у?) я 


Paso 18 Si 1 < п entonces 


517 < n entonces determine о; = а; + Л; 


Фи = Qu + лә 
si no determine В; = fı — у; qe 
si no 
sif < n entonces determine В; = В; — y; 0. 
Paso 19 Sil < п entonces determine œu = Q + JÉ; 
В = Б +1. 

Paso 20 Resolver el sistema lineal Ас = b donde А = (a; ,), b = (Вг) y с = (у) para 

l<l<nyl<t<n. 
Paso 21 SALIDA (y1,... > уһ). 

(Para cada k= 1,... ‚т sea фк = м? еп Т; si E, = Се y? 

Entonces ф(х, у) = У у укфеб(х, y) aproxima u(x, y) en D U Sı U S2.) 
Paso 22 Parai=1,...,M 

para ј = 1,2,3 SALIDA (ay, po, cP) | 


Paso 23 PARE. (El procedimiento está completo .) п 


12.4 Una introducción al método de elementos finitos 577 


Ilustración La temperatura u(x, y), en una región bidimensional D satisface la ecuación de Laplace 


д2и д2и 
ктш ыйсы ы еы еп D. 


Considere la región D mostrada en la figura 12.17 con condiciones en la frontera determi- 


nadas por 
u(x, у) = 4, para (x, y) € Ló y (x, y) € 17; 
ðu 
эп? =*, para (x, y) € La y (x, y) € La; 
ди 
т (X%, y) = y, рага (x, y) € L5; 
on 
ди x+y 
z4x, y) = , ‚„у) є і y) є L3, 
ar y) 5 рага (x, y) € Lı y (x, y) € L3 


donde ди /дп denota la derivada direccional en la dirección de la normal п para la frontera 
de la región D en el punto (x, y). 


Figura 12.17 


15 


Primero subdividimos Р en triángulos con la etiqueta sugerida en el paso O del algoritmo. 
Para este ejemplo, Sı = L6 U L7 y S2 = Lı U L2 U L3 U L4 U L5. El etiquetado de los trián- 
gulos se muestra en la figura 12.18. 

La condición en la frontera u(x, y) sobre Le y 17 implica que у, = 4 cuando t = 6,7, 
.. . , 11, es decir, еп los nodos Es, Ез, ... Е. Para determinar los valores de y; para! = 1, 
2,... , 5, aplique los pasos restantes del algoritmo y genere la matriz 


2.5 0 —1 0 0 
0 15 =1 =0.5 0 
A=| —1 —1 4 0 0 
0 —0.5 0 25 У. 
0 0 0 —0.5 1 
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Figura 12.18 


y el vector 
6.0666 
0.0633 
b= | 8.0000 
6.0566 
2.0316 
La solución de la ecuación Ac = b es 
Y 4.0383 
Y 4.0782 
с= | y = | 4.0291 
y4 4.0496 
y5 4.0565 


Resolver este sistema da la siguiente aproximación para la solución de la ecuación de Lapla- 
ce y las condiciones de frontera en los triángulos respectivos: 


Ti: 
Т»: 
Т; : 
ТА 
Ts: 
16 
Ту: 
T; : 
To : 
Tio : 


ф(х, у) = 4.0383(1 — 5х + 5y) + 4.0291 (—2 + 10x) + 4(2 — 5x — 5y), 
ф(х, у) = 4.0782(-2 + 5x + 5y) + 4.0291(4 — 10x) + 4-1 + 5x — 5y), 
ф(х, y) = 4-1 + 5y) + 4(2 — 5x — 5y) + 4.0383(5x), 

ф(х, y) = 4.0383(1 — 5х + 5y) + 4.0782(-2 + 5x + 5y) + 4.0291(2 — 10y), 
ф(х, у) = 4.0782(2 — 5х + 5y) + 4.0496(-4 + 10x) + 4(3 — 5x — 5y), 

ф(х, у) = 4.0496(6 — 10x) + 4.0565(—6 + 10x + 10у) +4(1 — 10y), 

ф(х, y) = 4(—5х +5 y) + 4.0383(5х) + 4(1 — 5y), 

ф(х, у) = 4.0383(5 y) + 4(1 — 5x) + 4(5х — 5y), 

ф(х, y) = 4.0291 (10y) + 4(2 — 5x — Sy) + 4(-1 + 5x — 5y), 

ф(х, y) = 4.0496(10y) + 4(3 — 5x — 5y) + 4(-2 + 5x — 5y). 


La solución real del problema de valor en la frontera es u(x, у) = xy + 4. La tabla 12.7 com- 
para el valor de и con el valor de ф en E;, para cada i = 1,..., 5. ш 
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Tabla 12.7, y pay) uy) (фо, у) ибх, y) 
0.2 0.2 4.0383 4.04 0.0017 
0.4 0.2 4.0782 4.08 0.0018 
0.3 0.1 4.0291 4.03 0.0009 
0.5 0.1 4.0496 4.05 0.0004 
0.6 0.1 4.0565 4.06 0.0035 


Normalmente, el error de los problemas elípticos de segundo orden del tipo (12.27) con 
funciones de coeficiente suave es О(Р?), donde h es el diámetro máximo de los elementos 
triangulares. Las funciones base bilineales por tramos en elementos rectangulares también 
se espera que proporcionen resultados O(h?), donde h es la longitud diagonal máxima de los 
elementos rectangulares. Otras clases de funciones base se pueden usar para proporcionar 
resultados O(h*), pero la construcción es más compleja. Los teoremas de error eficiente para 
los métodos de elementos finitos son difíciles de establecer y de aplicar ya que la exactitud 
de la aproximación depende de la regularidad de la frontera, así como de las propiedades de 
continuidad de la solución. 

El método de elementos finitos también se puede aplicar a las ecuaciones diferenciales 
parciales parabólicas e hiperbólicas, pero el procedimiento de minimización es más difícil. 
Un buen estudio sobre las ventajas y las técnicas del método de elementos finitos aplicado 
a varios problemas físicos se puede encontrar en el artículo de [Fi]. Para un análisis más 
extenso, consulte [SF], [ZM] o [AB]. 


La sección Conjunto de ejercicios 12.4 está disponible en línea. Encuentre la ruta de 
acceso en las páginas preliminares. 


WN 4 12.5 Software numérico 


Una de las subrutinas a partir de la Biblioteca IMSL se usa para la ecuación diferencial 
parcial 


con condiciones de frontera 


о(х, tju(x,t)+ (x, n*o, 1) = y(x,t). 


La rutina está basada en colocación ер los puntos gaussianos еп el eje х para cada valor de t 
y usa splines cúbicos de Hermite como funciones base. Otra subrutina de IMSL se usa para 
resolver la ecuación de Poisson en un rectángulo. El método de solución está basado en una 
selección de diferencias finitas de segundo y cuarto orden en una malla uniforme. 

La librería NAG tiene un número de subrutinas para ecuaciones diferenciales parciales. 
Se utiliza una subrutina para la ecuación de Laplace en un dominio arbitrario en el plano xy y 
otro para resolver una ecuación diferencial parcial parabólica mediante el método de líneas. 

Existen paquetes especializados, como NASTRAN, que consisten en códigos para el 
método de elementos finitos. Estos paquetes son populares en aplicaciones de ingeniería. El 
paquete FISHPACK en la biblioteca Netlib se usa para resolver ecuaciones diferenciales par- 
ciales elípticas separables. Los códigos generales para las ecuaciones diferenciales parciales 
son difíciles de escribir debido al problema de especificación de dominios diferentes a figu- 
ras geométricas comunes. Actualmente, la investigación en el área de solución de ecuaciones 
diferenciales parciales está muy activa. 


Las secciones Preguntas de análisis, Conceptos clave y Revisión del capítulo están dis- 
ponibles en línea. Encuentre la ruta de acceso en las páginas preliminares. 


Análisis numérico, 10a. ed., se escribió para que los estudiantes de ingeniería, 
matemáticas, ciencias de la computación puedan usarlo en los cursos sobre la teoría 
y la aplicación de técnicas de aproximación numérica. 


Prácticamente todos los conceptos en el texto están ilustrados con un ejemplo 
y contiene más de 2500 ejercicios probados en clase que van desde aplicaciones 
fundamentales de métodos y algoritmos hasta generalizaciones y extensiones de 
la teoría. Además, los conjuntos de ejercicios incluyen varios problemas aplicados 
de diversas áreas de la ingeniería, así como de la física, la informática, la biolo- 
gía y las ciencias económicas y sociales. Las aplicaciones, seleccionadas de forma 
clara y concisa, demuestran la manera en la que las técnicas numéricas se aplican 
en situaciones de la vida real. 
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